gitextract_586tz2l0/ ├── .github/ │ ├── CODEOWNERS │ ├── ISSUE_TEMPLATE/ │ │ └── config.yml │ └── workflows/ │ └── CI.yml ├── .gitignore ├── CMakeLists.txt ├── LICENSE ├── MANIFEST.in ├── README.md ├── USAGE_POLICY ├── _build/ │ └── gpt_oss_build_backend/ │ ├── __init__.py │ └── backend.py ├── awesome-gpt-oss.md ├── compatibility-test/ │ ├── .gitignore │ ├── README.md │ ├── analysis.ts │ ├── cases.jsonl │ ├── index.ts │ ├── package.json │ ├── providers.ts │ ├── runCase.ts │ └── tools.ts ├── examples/ │ ├── agents-sdk-js/ │ │ ├── index.ts │ │ └── package.json │ ├── agents-sdk-python/ │ │ ├── example.py │ │ └── pyproject.toml │ ├── gradio/ │ │ └── gradio_chat.py │ ├── reinforcement-fine-tuning.ipynb │ └── streamlit/ │ └── streamlit_chat.py ├── gpt-oss-mcp-server/ │ ├── README.md │ ├── browser_server.py │ ├── build-system-prompt.py │ ├── pyproject.toml │ ├── python_server.py │ └── reference-system-prompt.py ├── gpt_oss/ │ ├── __init__.py │ ├── chat.py │ ├── evals/ │ │ ├── README.md │ │ ├── __init__.py │ │ ├── __main__.py │ │ ├── abcd_grader.py │ │ ├── aime_eval.py │ │ ├── basic_eval.py │ │ ├── chat_completions_sampler.py │ │ ├── gpqa_eval.py │ │ ├── healthbench_eval.py │ │ ├── report.py │ │ ├── responses_sampler.py │ │ └── types.py │ ├── generate.py │ ├── metal/ │ │ ├── CMakeLists.txt │ │ ├── __init__.py │ │ ├── benchmark/ │ │ │ ├── end-to-end-threadgroup.cc │ │ │ ├── end-to-end.cc │ │ │ ├── f32-bf16w-rmsnorm.cc │ │ │ ├── f32-random.cc │ │ │ ├── mf4-f32-convert.cc │ │ │ └── u32-random.cc │ │ ├── examples/ │ │ │ ├── chat.py │ │ │ └── generate.py │ │ ├── include/ │ │ │ ├── gpt-oss/ │ │ │ │ ├── functions.h │ │ │ │ ├── macros.h │ │ │ │ └── types.h │ │ │ └── gpt-oss.h │ │ ├── python/ │ │ │ ├── context.c │ │ │ ├── model.c │ │ │ ├── module.c │ │ │ ├── module.h │ │ │ └── tokenizer.c │ │ ├── scripts/ │ │ │ └── create-local-model.py │ │ ├── source/ │ │ │ ├── accumulate.metal │ │ │ ├── context.c │ │ │ ├── convert.metal │ │ │ ├── embeddings.metal │ │ │ ├── expert_routing_metadata.metal │ │ │ ├── gather_and_accumulate.metal │ │ │ ├── generate.c │ │ │ ├── include/ │ │ │ │ └── internal/ │ │ │ │ ├── datatype.h │ │ │ │ ├── datatype.hpp │ │ │ │ ├── kernel-args.h │ │ │ │ ├── log.h │ │ │ │ ├── macros.h │ │ │ │ ├── math.h │ │ │ │ ├── metal-kernels.h │ │ │ │ ├── metal.h │ │ │ │ ├── metal.hpp │ │ │ │ ├── model.h │ │ │ │ ├── rng.h │ │ │ │ ├── rng.hpp │ │ │ │ ├── storage.h │ │ │ │ └── uuid.h │ │ │ ├── log.c │ │ │ ├── matmul.metal │ │ │ ├── metal-kernels.c │ │ │ ├── metal.m │ │ │ ├── model.c │ │ │ ├── moematmul.metal │ │ │ ├── random.metal │ │ │ ├── rmsnorm.metal │ │ │ ├── rope.metal │ │ │ ├── sample.metal │ │ │ ├── scatter.metal │ │ │ ├── sdpa.metal │ │ │ ├── tokenizer.c │ │ │ └── topk.metal │ │ └── test/ │ │ ├── bf16-f32-embeddings.cc │ │ ├── embeddings-kernel-tester.hpp │ │ ├── f32-bf16w-matmul.cc │ │ ├── f32-bf16w-rmsnorm.cc │ │ ├── f32-random.cc │ │ ├── f32-rope.cc │ │ ├── fill-random-kernel-tester.hpp │ │ ├── matmul-kernel-tester.hpp │ │ ├── mf4-f32-convert.cc │ │ ├── rmsnorm-kernel-tester.hpp │ │ ├── rope-kernel-tester.hpp │ │ └── u32-random.cc │ ├── responses_api/ │ │ ├── __init__.py │ │ ├── api_server.py │ │ ├── events.py │ │ ├── inference/ │ │ │ ├── __init__.py │ │ │ ├── metal.py │ │ │ ├── ollama.py │ │ │ ├── stub.py │ │ │ ├── transformers.py │ │ │ ├── triton.py │ │ │ └── vllm.py │ │ ├── serve.py │ │ ├── types.py │ │ └── utils.py │ ├── tokenizer.py │ ├── tools/ │ │ ├── __init__.py │ │ ├── apply_patch.md │ │ ├── apply_patch.py │ │ ├── python_docker/ │ │ │ └── docker_tool.py │ │ ├── simple_browser/ │ │ │ ├── __init__.py │ │ │ ├── backend.py │ │ │ ├── page_contents.py │ │ │ └── simple_browser_tool.py │ │ └── tool.py │ ├── torch/ │ │ ├── __init__.py │ │ ├── model.py │ │ ├── utils.py │ │ └── weights.py │ ├── triton/ │ │ ├── __init__.py │ │ ├── attention.py │ │ ├── model.py │ │ └── moe.py │ └── vllm/ │ └── token_generator.py ├── pyproject.toml ├── tests/ │ ├── conftest.py │ ├── gpt_oss/ │ │ └── tools/ │ │ └── simple_browser/ │ │ └── test_backend.py │ ├── test_api_endpoints.py │ └── test_responses_api.py └── tests-data/ ├── basic-event-stream.txt └── web-search-event-stream.txt