gitextract_1w8c2ho6/ ├── .actor/ │ ├── Dockerfile │ ├── README.md │ ├── actor.json │ ├── bin/ │ │ └── actor.sh │ ├── dataset_schema.json │ └── input_schema.json ├── .dockerignore ├── .github/ │ ├── FUNDING.yml │ └── workflows/ │ ├── build_gnu_linux.yml │ ├── build_macos.yml │ ├── build_windows.yml │ ├── cd.yml │ ├── ci-netbsd.yml │ └── ci.yml ├── .gitignore ├── Cargo.toml ├── Dockerfile ├── LICENSE ├── Makefile ├── README.md ├── assets/ │ └── icon/ │ └── icon.blend ├── dist/ │ └── run-in-container.sh ├── monolith.nuspec ├── snap/ │ └── snapcraft.yaml ├── src/ │ ├── cache.rs │ ├── cookies.rs │ ├── core.rs │ ├── css.rs │ ├── gui.rs │ ├── html.rs │ ├── js.rs │ ├── lib.rs │ ├── main.rs │ ├── session.rs │ └── url.rs └── tests/ ├── _data_/ │ ├── basic/ │ │ ├── local-file.html │ │ ├── local-script.js │ │ └── local-style.css │ ├── css/ │ │ ├── index.html │ │ └── style.css │ ├── import-css-via-data-url/ │ │ ├── index.html │ │ └── style.css │ ├── integrity/ │ │ ├── index.html │ │ ├── script.js │ │ └── style.css │ ├── noscript/ │ │ ├── index.html │ │ ├── nested.html │ │ └── script.html │ ├── svg/ │ │ ├── image.html │ │ ├── index.html │ │ └── svg.html │ └── unusual_encodings/ │ ├── gb2312.html │ └── iso-8859-1.html ├── cli/ │ ├── base_url.rs │ ├── basic.rs │ ├── data_url.rs │ ├── local_files.rs │ ├── mod.rs │ ├── noscript.rs │ └── unusual_encodings.rs ├── cookies/ │ ├── cookie/ │ │ ├── is_expired.rs │ │ ├── matches_url.rs │ │ └── mod.rs │ ├── mod.rs │ └── parse_cookie_file_contents.rs ├── core/ │ ├── detect_media_type.rs │ ├── format_output_path.rs │ ├── mod.rs │ ├── options.rs │ └── parse_content_type.rs ├── css/ │ ├── embed_css.rs │ ├── is_image_url_prop.rs │ └── mod.rs ├── html/ │ ├── add_favicon.rs │ ├── check_integrity.rs │ ├── compose_csp.rs │ ├── create_metadata_tag.rs │ ├── embed_srcset.rs │ ├── get_base_url.rs │ ├── get_charset.rs │ ├── get_node_attr.rs │ ├── get_node_name.rs │ ├── has_favicon.rs │ ├── is_favicon.rs │ ├── mod.rs │ ├── parse_link_type.rs │ ├── parse_srcset.rs │ ├── serialize_document.rs │ ├── set_node_attr.rs │ └── walk.rs ├── js/ │ ├── attr_is_event_handler.rs │ └── mod.rs ├── mod.rs ├── session/ │ ├── mod.rs │ └── retrieve_asset.rs └── url/ ├── clean_url.rs ├── create_data_url.rs ├── domain_is_within_domain.rs ├── get_referer_url.rs ├── is_url_and_has_protocol.rs ├── mod.rs ├── parse_data_url.rs └── resolve_url.rs