gitextract_o4yltvbb/ ├── .github/ │ └── workflows/ │ ├── build-site.yaml │ ├── build.yaml │ ├── linter.yaml │ ├── security.yaml │ └── tests.yaml ├── .gitignore ├── .gitmodules ├── .husky/ │ └── pre-commit ├── .lintstagedrc.json ├── .nvmrc ├── .prettierignore ├── .prettierrc ├── CONTRIBUTING.md ├── LICENSE ├── README.md ├── SECURITY.md ├── cleanup-index-js.sh ├── docs/ │ ├── Makefile │ ├── README.md │ ├── conf.py │ ├── developer/ │ │ ├── add_models.rst │ │ └── building_from_source.rst │ ├── index.rst │ ├── make.bat │ ├── requirements.txt │ └── user/ │ ├── advanced_usage.rst │ ├── api_reference.rst │ ├── basic_usage.rst │ └── get_started.rst ├── eslint.config.cjs ├── examples/ │ ├── .gitignore │ ├── README.md │ ├── abort-reload/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── get_started.html │ │ └── get_started.js │ ├── cache-usage/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── cache_usage.html │ │ └── cache_usage.ts │ ├── chrome-extension/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── content.js │ │ ├── example.html │ │ ├── manifest.json │ │ ├── manifest_v2.json │ │ ├── popup.css │ │ ├── popup.html │ │ └── popup.ts │ ├── chrome-extension-webgpu-service-worker/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── background.ts │ │ ├── content.js │ │ ├── example.html │ │ ├── manifest.json │ │ ├── popup.css │ │ ├── popup.html │ │ └── popup.ts │ ├── embeddings/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── embeddings.html │ │ └── embeddings.ts │ ├── function-calling/ │ │ ├── README.md │ │ ├── function-calling-manual/ │ │ │ ├── README.md │ │ │ ├── package.json │ │ │ └── src/ │ │ │ ├── function_calling_manual.html │ │ │ └── function_calling_manual.ts │ │ └── function-calling-openai/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── function_calling_openai.html │ │ └── function_calling_openai.ts │ ├── get-started/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── get_started.html │ │ └── get_started.ts │ ├── get-started-latency-breakdown/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── get_started_latency_breakdown.html │ │ └── get_started_latency_breakdown.ts │ ├── get-started-web-worker/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── get_started.html │ │ ├── main.ts │ │ └── worker.ts │ ├── json-mode/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── json_mode.html │ │ └── json_mode.ts │ ├── json-schema/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── json_schema.html │ │ └── json_schema.ts │ ├── logit-processor/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── logit_processor.html │ │ ├── logit_processor.ts │ │ ├── my_logit_processor.ts │ │ └── worker.ts │ ├── multi-models/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── main.ts │ │ ├── multi_models.html │ │ └── worker.ts │ ├── multi-round-chat/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── multi_round_chat.html │ │ └── multi_round_chat.ts │ ├── next-simple-chat/ │ │ ├── .gitignore │ │ ├── README.md │ │ ├── next.config.js │ │ ├── package.json │ │ ├── postcss.config.js │ │ ├── src/ │ │ │ ├── pages/ │ │ │ │ ├── _app.tsx │ │ │ │ ├── _document.tsx │ │ │ │ ├── api/ │ │ │ │ │ └── hello.ts │ │ │ │ └── index.tsx │ │ │ ├── styles/ │ │ │ │ └── globals.css │ │ │ └── utils/ │ │ │ ├── chat_component.tsx │ │ │ └── chat_ui.ts │ │ ├── tailwind.config.js │ │ └── tsconfig.json │ ├── qwen3/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── qwen3_example.html │ │ └── qwen3_example.ts │ ├── seed-to-reproduce/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── seed.html │ │ └── seed.ts │ ├── service-worker/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── index.html │ │ ├── main.ts │ │ └── sw.ts │ ├── simple-chat-js/ │ │ ├── index.css │ │ ├── index.html │ │ └── index.js │ ├── simple-chat-ts/ │ │ ├── .gitignore │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── gh-config.js │ │ ├── llm_chat.css │ │ ├── llm_chat.html │ │ ├── simple_chat.ts │ │ └── worker.ts │ ├── simple-chat-upload/ │ │ ├── .gitignore │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── gh-config.js │ │ ├── llm_chat.css │ │ ├── llm_chat.html │ │ ├── simple_chat.ts │ │ └── worker.ts │ ├── streaming/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── streaming.html │ │ └── streaming.ts │ ├── structural-tag-tool-use/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── mcp_structural_tag.html │ │ └── mcp_structural_tag.ts │ ├── text-completion/ │ │ ├── README.md │ │ ├── package.json │ │ └── src/ │ │ ├── text_completion.html │ │ └── text_completion.ts │ └── vision-model/ │ ├── README.md │ ├── package.json │ └── src/ │ ├── utils.ts │ ├── vision_model.html │ ├── vision_model.ts │ └── worker.ts ├── jest.config.cjs ├── licenses/ │ └── license.openai_node.txt ├── package.json ├── rollup.config.js ├── scripts/ │ ├── gh_deploy_site.sh │ ├── local_deploy_site.sh │ ├── prep_deps.sh │ └── serve_mlc_llm_dist.sh ├── site/ │ ├── .gitignore │ ├── _config.yml │ ├── _includes/ │ │ ├── head.html │ │ └── hero.html │ ├── assets/ │ │ ├── css/ │ │ │ └── hero.scss │ │ └── video/ │ │ ├── Code.webm │ │ └── Pittsburgh.webm │ └── index.md ├── src/ │ ├── cache_util.ts │ ├── config.ts │ ├── conversation.ts │ ├── embedding.ts │ ├── engine.ts │ ├── error.ts │ ├── extension_service_worker.ts │ ├── index.ts │ ├── llm_chat.ts │ ├── message.ts │ ├── openai_api_protocols/ │ │ ├── chat_completion.ts │ │ ├── completion.ts │ │ ├── embedding.ts │ │ └── index.ts │ ├── service_worker.ts │ ├── support.ts │ ├── types.ts │ ├── utils.ts │ └── web_worker.ts ├── tests/ │ ├── .gitignore │ ├── cache_util.test.ts │ ├── constants.ts │ ├── conversation.test.ts │ ├── embedding_stats.test.ts │ ├── engine_integration.test.ts │ ├── extension_service_worker.test.ts │ ├── function_calling.test.ts │ ├── generation_config.test.ts │ ├── llm_chat_pipeline.test.ts │ ├── multi_round_chat.test.ts │ ├── openai_chat_completion.test.ts │ ├── openai_completion.test.ts │ ├── openai_embeddings.test.ts │ ├── scripts/ │ │ └── sanity_checks/ │ │ ├── README.md │ │ ├── package.json │ │ ├── sanity_checks.html │ │ └── sanity_checks.ts │ ├── service_worker.test.ts │ ├── util.test.ts │ └── web_worker_handler.test.ts ├── tsconfig.json └── utils/ ├── .gitignore └── vram_requirements/ ├── .gitignore ├── README.md ├── package.json └── src/ ├── gh-config.js ├── vram_requirements.html └── vram_requirements.ts