gitextract_d_6tdl44/ ├── .dockerignore ├── .gitattributes ├── .github/ │ ├── actions/ │ │ └── rust_build/ │ │ └── action.yml │ ├── requirements_github_actions.txt │ └── workflows/ │ ├── checks.yml │ └── rust-ci.yml ├── .gitignore ├── CONTRIBUTING.md ├── ISSUE_TEMPLATE/ │ ├── bug.yml │ └── question.yml ├── LICENSE-APACHE ├── LICENSE-MIT ├── LICENSE.md ├── PULL_REQUEST_TEMPLATE.md ├── README.md ├── client/ │ ├── .eslinrc.json │ ├── .nvmrc │ ├── .prettierignore │ ├── .prettierrc.json │ ├── Dockerfile │ ├── LICENSE │ ├── README.md │ ├── index.html │ ├── package.json │ ├── postcss.config.js │ ├── public/ │ │ └── assets/ │ │ ├── decoderWorker.min.wasm │ │ └── images/ │ │ └── demo/ │ │ └── attribution.txt │ ├── src/ │ │ ├── app.tsx │ │ ├── audio-processor.ts │ │ ├── components/ │ │ │ ├── Button/ │ │ │ │ └── Button.tsx │ │ │ ├── ImageGallery/ │ │ │ │ └── ImageGallery.tsx │ │ │ └── Input/ │ │ │ └── Input.tsx │ │ ├── decoder/ │ │ │ └── decoderWorker.ts │ │ ├── env.ts │ │ ├── index.css │ │ ├── modules.d.ts │ │ ├── pages/ │ │ │ ├── Conversation/ │ │ │ │ ├── Conversation.tsx │ │ │ │ ├── MediaContext.ts │ │ │ │ ├── SocketContext.ts │ │ │ │ ├── components/ │ │ │ │ │ ├── AudioVisualizer/ │ │ │ │ │ │ ├── AudioVisualizer.tsx │ │ │ │ │ │ ├── ClientVisualizer.tsx │ │ │ │ │ │ └── ServerVisualizer.tsx │ │ │ │ │ ├── Controls/ │ │ │ │ │ │ └── Controls.tsx │ │ │ │ │ ├── ModelParams/ │ │ │ │ │ │ └── ModelParams.tsx │ │ │ │ │ ├── ServerAudio/ │ │ │ │ │ │ ├── ServerAudio.tsx │ │ │ │ │ │ └── ServerAudioStats.tsx │ │ │ │ │ ├── ServerInfo/ │ │ │ │ │ │ └── ServerInfo.tsx │ │ │ │ │ ├── TextDisplay/ │ │ │ │ │ │ ├── TextDisplay.tsx │ │ │ │ │ │ └── TextDisplayStats.tsx │ │ │ │ │ └── UserAudio/ │ │ │ │ │ ├── UserAudio.tsx │ │ │ │ │ └── UserAudioStats.tsx │ │ │ │ ├── getMimeType.ts │ │ │ │ └── hooks/ │ │ │ │ ├── audioUtils.ts │ │ │ │ ├── useModelParams.ts │ │ │ │ ├── useServerAudio.ts │ │ │ │ ├── useServerInfo.ts │ │ │ │ ├── useServerText.ts │ │ │ │ ├── useSocket.ts │ │ │ │ └── useUserAudio.ts │ │ │ └── Queue/ │ │ │ ├── Queue.tsx │ │ │ ├── api/ │ │ │ │ ├── client.ts │ │ │ │ ├── errors/ │ │ │ │ │ ├── api_error.ts │ │ │ │ │ └── response_error.ts │ │ │ │ └── validators.ts │ │ │ └── hooks/ │ │ │ └── useUserEmail.ts │ │ └── protocol/ │ │ ├── encoder.ts │ │ ├── testMessages.ts │ │ └── types.ts │ ├── tailwind.config.js │ ├── tsconfig.json │ └── vite.config.ts ├── docker-bake.hcl ├── kyuteye_mlx/ │ ├── .pylintrc │ ├── LICENSE │ ├── MANIFEST.in │ ├── README.md │ ├── kyuteye_mlx/ │ │ ├── __init__.py │ │ ├── benchmark.py │ │ ├── local_web.py │ │ ├── mlx_vlm/ │ │ │ ├── LICENSE │ │ │ ├── __init__.py │ │ │ └── models/ │ │ │ ├── __init__.py │ │ │ ├── pixtral/ │ │ │ │ ├── __init__.py │ │ │ │ └── vision.py │ │ │ └── siglip/ │ │ │ └── vision.py │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── generate.py │ │ │ ├── lm.py │ │ │ ├── pixtral.py │ │ │ └── siglip.py │ │ ├── modules/ │ │ │ ├── __init__.py │ │ │ ├── config.py │ │ │ ├── cross_attention.py │ │ │ ├── kv_cache.py │ │ │ └── transformer.py │ │ ├── py.typed │ │ ├── quantize.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── loading.py │ │ ├── profiling.py │ │ └── sampling.py │ ├── pixtral-12b-8bit.config │ ├── pyproject.toml │ ├── siglip448.config │ └── tests/ │ └── test_siglip.py ├── kyuteye_pt/ │ ├── .pylintrc │ ├── LICENSE.md │ ├── README.md │ ├── configs/ │ │ └── moshika-vis.yaml │ ├── kyuteye/ │ │ ├── __init__.py │ │ ├── config/ │ │ │ ├── __init__.py │ │ │ ├── enums.py │ │ │ ├── kyuteye_config.py │ │ │ └── subconfigs.py │ │ ├── models/ │ │ │ ├── __init__.py │ │ │ ├── docker-bake.hcl │ │ │ ├── helium.py │ │ │ ├── hf_model_configs.py │ │ │ ├── image_projection.py │ │ │ ├── loaders.py │ │ │ └── moshivis.py │ │ ├── modules/ │ │ │ ├── __init__.py │ │ │ ├── attention.py │ │ │ ├── cross_attention.py │ │ │ ├── image_encoder.py │ │ │ ├── image_transforms.py │ │ │ ├── streaming_utils.py │ │ │ ├── transformer.py │ │ │ └── utils.py │ │ ├── server.py │ │ └── utils/ │ │ ├── __init__.py │ │ ├── dist_utils.py │ │ ├── logging_utils.py │ │ └── struct_utils.py │ ├── pyproject.toml │ └── tests/ │ └── hello.py ├── kyuteye_rs/ │ ├── Cargo.toml │ ├── configs/ │ │ ├── config-moshika-vis-q8.json │ │ └── config-moshika-vis.json │ ├── moshi-backend/ │ │ ├── Cargo.toml │ │ ├── build.rs │ │ └── src/ │ │ ├── audio.rs │ │ ├── build.rs │ │ ├── image_embedder.rs │ │ ├── main.rs │ │ ├── metrics.rs │ │ ├── standalone.rs │ │ ├── stream_both.rs │ │ └── utils.rs │ └── moshi-core/ │ ├── Cargo.toml │ └── src/ │ ├── conv.rs │ ├── dynamic_logits_processor.rs │ ├── lib.rs │ ├── lm.rs │ ├── lm_generate.rs │ ├── lm_generate_multistream.rs │ ├── mimi.rs │ ├── nn.rs │ ├── quantization.rs │ ├── seanet.rs │ ├── streaming.rs │ └── transformer.rs ├── scripts/ │ ├── convert_ckpt_utils.py │ └── get_static_client.py └── ssvd/ ├── README.md ├── __init__.py ├── generate.py ├── multiturn_instruct.py ├── multiturn_prompting.py └── utils.py