gitextract_8bcuz138/ ├── .github/ │ ├── ISSUE_TEMPLATE/ │ │ ├── 01-bug-low.yml │ │ ├── 02-bug-medium.yml │ │ ├── 03-bug-high.yml │ │ ├── 04-bug-critical.yml │ │ ├── 05-enhancement.yml │ │ ├── 06-refactor.yml │ │ ├── 07-refactor.yml │ │ └── config.yml │ ├── labeler.yml │ └── workflows/ │ ├── ci.yml │ ├── docs.yml │ ├── editorconfig.yml │ ├── labeler.yml │ └── update-llama-cpp.yml ├── .gitignore ├── .gitmodules ├── .llamafile_plugin/ │ └── .claude-plugin/ │ ├── marketplace.json │ └── plugin.json ├── LICENSE ├── Makefile ├── README.md ├── README_0.10.0.md ├── RELEASE.md ├── build/ │ ├── config.mk │ ├── cudacc │ ├── deps.mk │ ├── download-cosmocc.sh │ ├── gperf │ ├── htags │ ├── llamafile-convert │ ├── llamafile-upgrade-engine │ ├── objdump │ ├── rules.mk │ ├── run │ ├── sha256sum.c │ └── tags.mk ├── cosmocc-override.cmake ├── docs/ │ ├── AGENTS.md │ ├── commands/ │ │ ├── build.md │ │ ├── check.md │ │ └── clean.md │ ├── creating_llamafiles.md │ ├── example_llamafiles.md │ ├── index.md │ ├── quickstart.md │ ├── running_llamafile.md │ ├── skills/ │ │ └── llamafile/ │ │ ├── SKILL.md │ │ ├── architecture.md │ │ ├── building.md │ │ ├── development.md │ │ ├── testing.md │ │ └── update_llamacpp.md │ ├── source_installation.md │ ├── support.md │ ├── technical_details.md │ ├── troubleshooting.md │ └── whisperfile/ │ ├── getting-started.md │ ├── gpu.md │ ├── index.md │ ├── packaging.md │ ├── server.md │ └── translate.md ├── llama.cpp.patches/ │ ├── README.md │ ├── apply-patches.sh │ ├── llamafile-files/ │ │ ├── BUILD.mk │ │ ├── README.llamafile │ │ └── common/ │ │ └── license.cpp │ ├── patches/ │ │ ├── common_arg.cpp.patch │ │ ├── common_chat.cpp.patch │ │ ├── common_common.cpp.patch │ │ ├── common_download.cpp.patch │ │ ├── common_log.cpp.patch │ │ ├── common_ngram-mod.cpp.patch │ │ ├── ggml_src_ggml-backend-impl.h.patch │ │ ├── ggml_src_ggml-backend-reg.cpp.patch │ │ ├── ggml_src_ggml-backend.cpp.patch │ │ ├── ggml_src_ggml-cuda_common.cuh.patch │ │ ├── ggml_src_ggml-cuda_ggml-cuda.cu.patch │ │ ├── ggml_src_ggml-cuda_solve_tri.cu.patch │ │ ├── ggml_src_ggml-cuda_vendors_cuda.h.patch │ │ ├── ggml_src_ggml-metal_ggml-metal.cpp.patch │ │ ├── ggml_src_gguf.cpp.patch │ │ ├── src_llama-mmap.cpp.patch │ │ ├── src_llama-mmap.h.patch │ │ ├── tools_server_server-queue.cpp.patch │ │ ├── tools_server_server.cpp.patch │ │ └── vendor_cpp-httplib_httplib.cpp.patch │ └── renames.sh ├── llamafile/ │ ├── BUILD.mk │ ├── args.cpp │ ├── args.h │ ├── bestline.c │ ├── bestline.h │ ├── build-functions.sh │ ├── chatbot.h │ ├── chatbot_api.cpp │ ├── chatbot_backend.h │ ├── chatbot_cli.cpp │ ├── chatbot_comm.cpp │ ├── chatbot_comp.cpp │ ├── chatbot_direct.cpp │ ├── chatbot_eval.cpp │ ├── chatbot_file.cpp │ ├── chatbot_help.cpp │ ├── chatbot_hint.cpp │ ├── chatbot_hist.cpp │ ├── chatbot_logo.cpp │ ├── chatbot_main.cpp │ ├── chatbot_repl.cpp │ ├── check_cpu.c │ ├── color.h │ ├── compute.cpp │ ├── compute.h │ ├── cuda.c │ ├── cuda.sh │ ├── datauri.cpp │ ├── datauri.h │ ├── extract_data_uris.cpp │ ├── highlight/ │ │ ├── BUILD.mk │ │ ├── color_bleeder.cpp │ │ ├── highlight.cpp │ │ ├── highlight.h │ │ ├── highlight_ada.cpp │ │ ├── highlight_asm.cpp │ │ ├── highlight_basic.cpp │ │ ├── highlight_bnf.cpp │ │ ├── highlight_c.cpp │ │ ├── highlight_c_test.cpp │ │ ├── highlight_cmake.cpp │ │ ├── highlight_cobol.cpp │ │ ├── highlight_create.gperf │ │ ├── highlight_csharp.cpp │ │ ├── highlight_css.cpp │ │ ├── highlight_d.cpp │ │ ├── highlight_forth.cpp │ │ ├── highlight_fortran.cpp │ │ ├── highlight_go.cpp │ │ ├── highlight_haskell.cpp │ │ ├── highlight_html.cpp │ │ ├── highlight_java.cpp │ │ ├── highlight_js.cpp │ │ ├── highlight_julia.cpp │ │ ├── highlight_kotlin.cpp │ │ ├── highlight_ld.cpp │ │ ├── highlight_lisp.cpp │ │ ├── highlight_lua.cpp │ │ ├── highlight_m4.cpp │ │ ├── highlight_make.cpp │ │ ├── highlight_markdown.cpp │ │ ├── highlight_matlab.cpp │ │ ├── highlight_ocaml.cpp │ │ ├── highlight_pascal.cpp │ │ ├── highlight_perl.cpp │ │ ├── highlight_php.cpp │ │ ├── highlight_python.cpp │ │ ├── highlight_python_test.cpp │ │ ├── highlight_r.cpp │ │ ├── highlight_ruby.cpp │ │ ├── highlight_rust.cpp │ │ ├── highlight_scala.cpp │ │ ├── highlight_shell.cpp │ │ ├── highlight_sql.cpp │ │ ├── highlight_swift.cpp │ │ ├── highlight_tcl.cpp │ │ ├── highlight_test.cpp │ │ ├── highlight_tex.cpp │ │ ├── highlight_txt.cpp │ │ ├── highlight_typescript.cpp │ │ ├── highlight_zig.cpp │ │ ├── is_keyword_ada.gperf │ │ ├── is_keyword_ada_constant.gperf │ │ ├── is_keyword_asm_prefix.gperf │ │ ├── is_keyword_asm_qualifier.gperf │ │ ├── is_keyword_basic.gperf │ │ ├── is_keyword_basic_builtin.gperf │ │ ├── is_keyword_basic_constant.gperf │ │ ├── is_keyword_basic_type.gperf │ │ ├── is_keyword_c.gperf │ │ ├── is_keyword_c_builtin.gperf │ │ ├── is_keyword_c_constant.gperf │ │ ├── is_keyword_c_pod.gperf │ │ ├── is_keyword_c_type.gperf │ │ ├── is_keyword_cmake.gperf │ │ ├── is_keyword_cobol.gperf │ │ ├── is_keyword_cpp.gperf │ │ ├── is_keyword_csharp.gperf │ │ ├── is_keyword_csharp_constant.gperf │ │ ├── is_keyword_css_at.gperf │ │ ├── is_keyword_css_bang.gperf │ │ ├── is_keyword_cxx.gperf │ │ ├── is_keyword_d.gperf │ │ ├── is_keyword_d_constant.gperf │ │ ├── is_keyword_forth.gperf │ │ ├── is_keyword_forth_def.gperf │ │ ├── is_keyword_fortran.gperf │ │ ├── is_keyword_fortran_builtin.gperf │ │ ├── is_keyword_fortran_type.gperf │ │ ├── is_keyword_go.gperf │ │ ├── is_keyword_go_type.gperf │ │ ├── is_keyword_haskell.gperf │ │ ├── is_keyword_java.gperf │ │ ├── is_keyword_java_constant.gperf │ │ ├── is_keyword_js.gperf │ │ ├── is_keyword_js_builtin.gperf │ │ ├── is_keyword_js_constant.gperf │ │ ├── is_keyword_julia.gperf │ │ ├── is_keyword_kotlin.gperf │ │ ├── is_keyword_ld.gperf │ │ ├── is_keyword_ld_builtin.gperf │ │ ├── is_keyword_ld_warning.gperf │ │ ├── is_keyword_lisp.gperf │ │ ├── is_keyword_lua.gperf │ │ ├── is_keyword_lua_builtin.gperf │ │ ├── is_keyword_lua_constant.gperf │ │ ├── is_keyword_m4.gperf │ │ ├── is_keyword_make.gperf │ │ ├── is_keyword_make_builtin.gperf │ │ ├── is_keyword_matlab.gperf │ │ ├── is_keyword_matlab_builtin.gperf │ │ ├── is_keyword_matlab_constant.gperf │ │ ├── is_keyword_ocaml.gperf │ │ ├── is_keyword_ocaml_builtin.gperf │ │ ├── is_keyword_ocaml_constant.gperf │ │ ├── is_keyword_pascal.gperf │ │ ├── is_keyword_pascal_builtin.gperf │ │ ├── is_keyword_pascal_type.gperf │ │ ├── is_keyword_perl.gperf │ │ ├── is_keyword_php.gperf │ │ ├── is_keyword_php_constant.gperf │ │ ├── is_keyword_python.gperf │ │ ├── is_keyword_python_builtin.gperf │ │ ├── is_keyword_python_constant.gperf │ │ ├── is_keyword_r.gperf │ │ ├── is_keyword_r_builtin.gperf │ │ ├── is_keyword_r_constant.gperf │ │ ├── is_keyword_ruby.gperf │ │ ├── is_keyword_ruby_builtin.gperf │ │ ├── is_keyword_ruby_constant.gperf │ │ ├── is_keyword_rust.gperf │ │ ├── is_keyword_rust_constant.gperf │ │ ├── is_keyword_rust_type.gperf │ │ ├── is_keyword_scala.gperf │ │ ├── is_keyword_shell.gperf │ │ ├── is_keyword_shell_builtin.gperf │ │ ├── is_keyword_sql.gperf │ │ ├── is_keyword_sql_type.gperf │ │ ├── is_keyword_swift.gperf │ │ ├── is_keyword_swift_builtin.gperf │ │ ├── is_keyword_swift_constant.gperf │ │ ├── is_keyword_swift_type.gperf │ │ ├── is_keyword_tcl.gperf │ │ ├── is_keyword_tcl_builtin.gperf │ │ ├── is_keyword_tcl_type.gperf │ │ ├── is_keyword_typescript.gperf │ │ ├── is_keyword_typescript_type.gperf │ │ ├── is_keyword_zig.gperf │ │ ├── is_keyword_zig_builtin.gperf │ │ ├── is_keyword_zig_constant.gperf │ │ ├── is_keyword_zig_type.gperf │ │ ├── util.cpp │ │ └── util.h │ ├── image.cpp │ ├── image.h │ ├── iqk_mul_mat.inc │ ├── iqk_mul_mat_amd_avx2.cpp │ ├── iqk_mul_mat_amd_zen4.cpp │ ├── iqk_mul_mat_arm82.cpp │ ├── llama.cpp │ ├── llama.h │ ├── llamafile.c │ ├── llamafile.h │ ├── macros.h │ ├── main.cpp │ ├── metal.c │ ├── rocm.sh │ ├── sgemm.cpp │ ├── sgemm.h │ ├── string.cpp │ ├── string.h │ ├── tinyblas-compat.h │ ├── tinyblas.cu │ ├── tinyblas.h │ ├── tinyblas_cpu.h │ ├── tinyblas_cpu_mixmul.inc │ ├── tinyblas_cpu_mixmul_amd_avx.cpp │ ├── tinyblas_cpu_mixmul_amd_avx2.cpp │ ├── tinyblas_cpu_mixmul_amd_avx512f.cpp │ ├── tinyblas_cpu_mixmul_amd_avxvnni.cpp │ ├── tinyblas_cpu_mixmul_amd_fma.cpp │ ├── tinyblas_cpu_mixmul_amd_zen4.cpp │ ├── tinyblas_cpu_mixmul_arm80.cpp │ ├── tinyblas_cpu_mixmul_arm82.cpp │ ├── tinyblas_cpu_sgemm.inc │ ├── tinyblas_cpu_sgemm_amd_avx.cpp │ ├── tinyblas_cpu_sgemm_amd_avx2.cpp │ ├── tinyblas_cpu_sgemm_amd_avx512f.cpp │ ├── tinyblas_cpu_sgemm_amd_avxvnni.cpp │ ├── tinyblas_cpu_sgemm_amd_fma.cpp │ ├── tinyblas_cpu_sgemm_amd_zen4.cpp │ ├── tinyblas_cpu_sgemm_arm80.cpp │ ├── tinyblas_cpu_sgemm_arm82.cpp │ ├── tinyblas_cpu_unsupported.cpp │ ├── version.h │ ├── xterm.cpp │ ├── xterm.h │ ├── zip.c │ └── zip.h ├── localscore/ │ ├── BUILD.mk │ ├── README.md │ ├── apple.cpp │ ├── apple.h │ ├── ascii_digits.h │ ├── benchmark.cpp │ ├── benchmark.h │ ├── cmd.cpp │ ├── cmd.h │ ├── cuda.bat │ ├── cuda.sh │ ├── doc/ │ │ └── troubleshooting.md │ ├── http.cpp │ ├── http.h │ ├── localscore.cpp │ ├── localscore.h │ ├── main.cpp │ ├── net.h │ ├── nvml.cpp │ ├── nvml.h │ ├── powersampler.cpp │ ├── powersampler.h │ ├── printer.cpp │ ├── printer.h │ ├── rsmi.cpp │ ├── rsmi.h │ ├── system.cpp │ ├── system.h │ └── utils.h ├── mkdocs.yml ├── models/ │ └── TinyLLama-v0.1-5M-F16.gguf ├── stable-diffusion.cpp.patches/ │ ├── apply-patches.sh │ ├── llamafile-files/ │ │ ├── BUILD.mk │ │ ├── README.llamafile │ │ ├── darts.h │ │ ├── main.cpp │ │ ├── miniz.h │ │ ├── zip.c │ │ └── zip.h │ └── patches/ │ └── save.patch ├── tests/ │ ├── BUILD.mk │ ├── extract_data_uris_test.cpp │ ├── integration/ │ │ ├── README.md │ │ ├── conftest.py │ │ ├── pyproject.toml │ │ ├── run_tests.sh │ │ ├── tests/ │ │ │ ├── test_cli.py │ │ │ ├── test_combined.py │ │ │ ├── test_gpu.py │ │ │ ├── test_multimodal.py │ │ │ ├── test_server.py │ │ │ ├── test_tool_calling.py │ │ │ └── test_tui.py │ │ └── utils/ │ │ └── llamafile.py │ └── sgemm/ │ ├── BUILD.mk │ ├── iqk_test.cpp │ ├── q8_0_layout_test.cpp │ ├── sgemm_matmul_test.cpp │ ├── sgemm_sss_test.cpp │ ├── sgemm_test_utils.h │ └── sgemm_vecdot_test.cpp ├── third_party/ │ ├── BUILD.mk │ ├── double-conversion/ │ │ ├── .gitignore │ │ ├── AUTHORS │ │ ├── BUILD.mk │ │ ├── LICENSE │ │ ├── README.llamafile │ │ ├── SConscript │ │ ├── bignum-dtoa.cc │ │ ├── bignum-dtoa.h │ │ ├── bignum.cc │ │ ├── bignum.h │ │ ├── cached-powers.cc │ │ ├── cached-powers.h │ │ ├── diy-fp.h │ │ ├── double-conversion.h │ │ ├── double-to-string.cc │ │ ├── double-to-string.h │ │ ├── fast-dtoa.cc │ │ ├── fast-dtoa.h │ │ ├── fixed-dtoa.cc │ │ ├── fixed-dtoa.h │ │ ├── ieee.h │ │ ├── string-to-double.cc │ │ ├── string-to-double.h │ │ ├── strtod.cc │ │ ├── strtod.h │ │ └── utils.h │ ├── mbedtls/ │ │ ├── BUILD.mk │ │ ├── LICENSE │ │ ├── README.cosmo │ │ ├── README.llamafile │ │ ├── aes.c │ │ ├── aes.h │ │ ├── aesce.c │ │ ├── aesce.h │ │ ├── aesni.c │ │ ├── aesni.h │ │ ├── asn1.h │ │ ├── asn1parse.c │ │ ├── asn1write.c │ │ ├── asn1write.h │ │ ├── base64.c │ │ ├── base64.h │ │ ├── bigmul.c │ │ ├── bigmul4.c │ │ ├── bignum.c │ │ ├── bignum.h │ │ ├── bignum_internal.h │ │ ├── bigshift.c │ │ ├── blake2b256.c │ │ ├── ccm.c │ │ ├── ccm.h │ │ ├── certs.c │ │ ├── certs.h │ │ ├── chacha20.c │ │ ├── chacha20.h │ │ ├── chachapoly.c │ │ ├── chachapoly.h │ │ ├── check.inc │ │ ├── chk.h │ │ ├── cipher.c │ │ ├── cipher.h │ │ ├── cipher_internal.h │ │ ├── cipher_wrap.c │ │ ├── common.h │ │ ├── config.h │ │ ├── ctr_drbg.c │ │ ├── ctr_drbg.h │ │ ├── debug.c │ │ ├── debug.h │ │ ├── des.c │ │ ├── des.h │ │ ├── describecode.c │ │ ├── dhm.c │ │ ├── dhm.h │ │ ├── ecdh.c │ │ ├── ecdh.h │ │ ├── ecdh_everest.c │ │ ├── ecdh_everest.h │ │ ├── ecdsa.c │ │ ├── ecdsa.h │ │ ├── ecp.c │ │ ├── ecp.h │ │ ├── ecp256.c │ │ ├── ecp384.c │ │ ├── ecp_curves.c │ │ ├── ecp_internal.h │ │ ├── ecpshl.c │ │ ├── endian.h │ │ ├── entropy.c │ │ ├── entropy.h │ │ ├── entropy_poll.c │ │ ├── entropy_poll.h │ │ ├── error.c │ │ ├── error.h │ │ ├── everest.c │ │ ├── everest.h │ │ ├── fastdiv.h │ │ ├── formatclientciphers.c │ │ ├── gcm.c │ │ ├── gcm.h │ │ ├── getalertdescription.c │ │ ├── getciphersuite.c │ │ ├── getciphersuitename.c │ │ ├── getsslstatename.c │ │ ├── hkdf.c │ │ ├── hkdf.h │ │ ├── hmac_drbg.c │ │ ├── hmac_drbg.h │ │ ├── iana.h │ │ ├── isciphersuitegood.c │ │ ├── karatsuba.c │ │ ├── math.h │ │ ├── md.c │ │ ├── md.h │ │ ├── md5.c │ │ ├── md5.h │ │ ├── md5t.c │ │ ├── mdtype.c │ │ ├── memory_buffer_alloc.c │ │ ├── memory_buffer_alloc.h │ │ ├── net_sockets.c │ │ ├── net_sockets.h │ │ ├── nist_kw.c │ │ ├── nist_kw.h │ │ ├── notice.c │ │ ├── oid.c │ │ ├── oid.h │ │ ├── param.c │ │ ├── pem.c │ │ ├── pem.h │ │ ├── pk.c │ │ ├── pk.h │ │ ├── pk_internal.h │ │ ├── pk_wrap.c │ │ ├── pkcs5.c │ │ ├── pkcs5.h │ │ ├── pkparse.c │ │ ├── pktype.c │ │ ├── pkwrite.c │ │ ├── platform.c │ │ ├── platform.h │ │ ├── poly1305.c │ │ ├── poly1305.h │ │ ├── profile.h │ │ ├── rando.c │ │ ├── rsa.c │ │ ├── rsa.h │ │ ├── rsa_internal.c │ │ ├── rsa_internal.h │ │ ├── san.c │ │ ├── san.h │ │ ├── secp256r1.c │ │ ├── secp384r1.c │ │ ├── select.h │ │ ├── sha1.c │ │ ├── sha1.h │ │ ├── sha1t.c │ │ ├── sha256.c │ │ ├── sha256.h │ │ ├── sha256t.c │ │ ├── sha512.c │ │ ├── sha512.h │ │ ├── sha512t.c │ │ ├── shakedescription.c │ │ ├── shiftright-avx.c │ │ ├── shiftright.c │ │ ├── sigalg.c │ │ ├── speed.sh │ │ ├── srtp.c │ │ ├── ssl.h │ │ ├── ssl_cache.c │ │ ├── ssl_cache.h │ │ ├── ssl_ciphersuites.c │ │ ├── ssl_ciphersuites.h │ │ ├── ssl_cli.c │ │ ├── ssl_cookie.c │ │ ├── ssl_cookie.h │ │ ├── ssl_internal.h │ │ ├── ssl_invasive.h │ │ ├── ssl_msg.c │ │ ├── ssl_srv.c │ │ ├── ssl_ticket.c │ │ ├── ssl_ticket.h │ │ ├── ssl_tls.c │ │ ├── ssl_tls13_keys.c │ │ ├── ssl_tls13_keys.h │ │ ├── sslroot/ │ │ │ ├── amazon.pem │ │ │ ├── certum.pem │ │ │ ├── comodo.pem │ │ │ ├── digicert.pem │ │ │ ├── geotrust.pem │ │ │ ├── globalsign.pem │ │ │ ├── godaddy.pem │ │ │ ├── google.pem │ │ │ ├── isrg.pem │ │ │ ├── quovadis.pem │ │ │ ├── redbean.pem │ │ │ ├── show.sh │ │ │ ├── starfield.pem │ │ │ └── verisign.pem │ │ ├── sslroots.c │ │ ├── version.h │ │ ├── x509.c │ │ ├── x509.h │ │ ├── x509_create.c │ │ ├── x509_crl.c │ │ ├── x509_crl.h │ │ ├── x509_crt.c │ │ ├── x509_crt.h │ │ ├── x509_csr.c │ │ ├── x509_csr.h │ │ ├── x509write_crt.c │ │ ├── x509write_csr.c │ │ └── zeroize.c │ ├── sqlite/ │ │ ├── BUILD.mk │ │ ├── README.llamafile │ │ ├── shell.c │ │ ├── sqlite3.c │ │ ├── sqlite3.h │ │ └── sqlite3ext.h │ └── stb/ │ ├── BUILD.mk │ ├── README.llamafile │ ├── stb_image.c │ ├── stb_image.h │ ├── stb_image_resize2.c │ ├── stb_image_resize2.h │ ├── stb_image_write.c │ ├── stb_image_write.h │ ├── stb_vorbis.c │ └── stb_vorbis.h ├── tools/ │ ├── check_patches.sh │ └── generate_patches.sh ├── whisper.cpp.patches/ │ ├── apply-patches.sh │ ├── llamafile-files/ │ │ └── BUILD.mk │ ├── patches/ │ │ ├── examples_cli_cli.cpp.patch │ │ ├── examples_common.cpp.patch │ │ ├── examples_miniaudio.h.patch │ │ ├── examples_server_server.cpp.patch │ │ └── ggml_src_ggml-backend-reg.cpp.patch │ └── renames.sh └── whisperfile/ ├── BUILD.mk ├── color.cpp ├── color.h ├── mic2raw.cpp ├── mic2txt.cpp ├── slurp.cpp ├── slurp.h ├── stream.cpp ├── whisper-server.1 ├── whisper-server.cpp ├── whisperfile.1 └── whisperfile.cpp