gitextract_o6a5td4x/ ├── .claude-plugin/ │ └── marketplace.json ├── .github/ │ └── workflows/ │ ├── claude.yml │ ├── publish-npm.yml │ └── sync-skills.yml ├── .gitignore ├── 0-autoresearch-skill/ │ ├── SKILL.md │ ├── references/ │ │ ├── agent-continuity.md │ │ ├── progress-reporting.md │ │ └── skill-routing.md │ └── templates/ │ ├── findings.md │ ├── progress-presentation.html │ ├── research-log.md │ └── research-state.yaml ├── 01-model-architecture/ │ ├── .gitkeep │ ├── litgpt/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── custom-models.md │ │ ├── distributed-training.md │ │ ├── supported-models.md │ │ └── training-recipes.md │ ├── mamba/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── architecture-details.md │ │ ├── benchmarks.md │ │ └── training-guide.md │ ├── nanogpt/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── architecture.md │ │ ├── data.md │ │ └── training.md │ ├── rwkv/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── architecture-details.md │ │ ├── rwkv7.md │ │ └── state-management.md │ └── torchtitan/ │ ├── SKILL.md │ └── references/ │ ├── checkpoint.md │ ├── custom-models.md │ ├── float8.md │ └── fsdp.md ├── 02-tokenization/ │ ├── .gitkeep │ ├── huggingface-tokenizers/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── algorithms.md │ │ ├── integration.md │ │ ├── pipeline.md │ │ └── training.md │ └── sentencepiece/ │ ├── SKILL.md │ └── references/ │ ├── algorithms.md │ └── training.md ├── 03-fine-tuning/ │ ├── axolotl/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── api.md │ │ ├── dataset-formats.md │ │ ├── index.md │ │ └── other.md │ ├── llama-factory/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── _images.md │ │ ├── advanced.md │ │ ├── getting_started.md │ │ ├── index.md │ │ └── other.md │ ├── peft/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── unsloth/ │ ├── SKILL.md │ └── references/ │ ├── index.md │ ├── llms-full.md │ ├── llms-txt.md │ └── llms.md ├── 04-mechanistic-interpretability/ │ ├── nnsight/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── README.md │ │ ├── api.md │ │ └── tutorials.md │ ├── pyvene/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── README.md │ │ ├── api.md │ │ └── tutorials.md │ ├── saelens/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── README.md │ │ ├── api.md │ │ └── tutorials.md │ └── transformer-lens/ │ ├── SKILL.md │ └── references/ │ ├── README.md │ ├── api.md │ └── tutorials.md ├── 05-data-processing/ │ ├── .gitkeep │ ├── nemo-curator/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── deduplication.md │ │ └── filtering.md │ └── ray-data/ │ ├── SKILL.md │ └── references/ │ ├── integration.md │ └── transformations.md ├── 06-post-training/ │ ├── grpo-rl-training/ │ │ ├── README.md │ │ ├── SKILL.md │ │ ├── examples/ │ │ │ └── reward_functions_library.py │ │ └── templates/ │ │ └── basic_grpo_training.py │ ├── miles/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── api-reference.md │ │ └── troubleshooting.md │ ├── openrlhf/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── algorithm-comparison.md │ │ ├── custom-rewards.md │ │ ├── hybrid-engine.md │ │ └── multi-node-training.md │ ├── simpo/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── datasets.md │ │ ├── hyperparameters.md │ │ └── loss-functions.md │ ├── slime/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── api-reference.md │ │ └── troubleshooting.md │ ├── torchforge/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── api-reference.md │ │ └── troubleshooting.md │ ├── trl-fine-tuning/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── dpo-variants.md │ │ ├── online-rl.md │ │ ├── reward-modeling.md │ │ └── sft-training.md │ └── verl/ │ ├── SKILL.md │ └── references/ │ ├── api-reference.md │ └── troubleshooting.md ├── 07-safety-alignment/ │ ├── .gitkeep │ ├── constitutional-ai/ │ │ └── SKILL.md │ ├── llamaguard/ │ │ └── SKILL.md │ ├── nemo-guardrails/ │ │ └── SKILL.md │ └── prompt-guard/ │ └── SKILL.md ├── 08-distributed-training/ │ ├── accelerate/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── custom-plugins.md │ │ ├── megatron-integration.md │ │ └── performance.md │ ├── deepspeed/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── 08.md │ │ ├── 09.md │ │ ├── 2020.md │ │ ├── 2023.md │ │ ├── assets.md │ │ ├── index.md │ │ ├── mii.md │ │ ├── other.md │ │ └── tutorials.md │ ├── megatron-core/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── benchmarks.md │ │ ├── parallelism-guide.md │ │ ├── production-examples.md │ │ └── training-recipes.md │ ├── pytorch-fsdp2/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── pytorch_dcp_async_recipe.md │ │ ├── pytorch_dcp_overview.md │ │ ├── pytorch_dcp_recipe.md │ │ ├── pytorch_ddp_notes.md │ │ ├── pytorch_device_mesh_tutorial.md │ │ ├── pytorch_examples_fsdp2.md │ │ ├── pytorch_fsdp1_api.md │ │ ├── pytorch_fsdp2_tutorial.md │ │ ├── pytorch_fully_shard_api.md │ │ ├── pytorch_tp_tutorial.md │ │ ├── ray_train_fsdp2_example.md │ │ └── torchtitan_fsdp_notes.md │ ├── pytorch-lightning/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── callbacks.md │ │ ├── distributed.md │ │ └── hyperparameter-tuning.md │ └── ray-train/ │ ├── SKILL.md │ └── references/ │ └── multi-node.md ├── 09-infrastructure/ │ ├── .gitkeep │ ├── lambda-labs/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── modal/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── skypilot/ │ ├── SKILL.md │ └── references/ │ ├── advanced-usage.md │ └── troubleshooting.md ├── 10-optimization/ │ ├── .gitkeep │ ├── awq/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── bitsandbytes/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── memory-optimization.md │ │ ├── qlora-training.md │ │ └── quantization-formats.md │ ├── flash-attention/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── benchmarks.md │ │ └── transformers-integration.md │ ├── gguf/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── gptq/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── calibration.md │ │ ├── integration.md │ │ └── troubleshooting.md │ ├── hqq/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── ml-training-recipes/ │ ├── SKILL.md │ └── references/ │ ├── architecture.md │ ├── biomedical.md │ ├── domain-specific.md │ ├── experiment-loop.md │ ├── optimizers.md │ └── scaling-and-selection.md ├── 11-evaluation/ │ ├── .gitkeep │ ├── bigcode-evaluation-harness/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── benchmarks.md │ │ ├── custom-tasks.md │ │ └── issues.md │ ├── lm-evaluation-harness/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── api-evaluation.md │ │ ├── benchmark-guide.md │ │ ├── custom-tasks.md │ │ └── distributed-eval.md │ └── nemo-evaluator/ │ ├── SKILL.md │ └── references/ │ ├── adapter-system.md │ ├── configuration.md │ ├── custom-benchmarks.md │ └── execution-backends.md ├── 12-inference-serving/ │ ├── .gitkeep │ ├── llama-cpp/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── optimization.md │ │ ├── quantization.md │ │ └── server.md │ ├── sglang/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── deployment.md │ │ ├── radix-attention.md │ │ └── structured-generation.md │ ├── tensorrt-llm/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── multi-gpu.md │ │ ├── optimization.md │ │ └── serving.md │ └── vllm/ │ ├── SKILL.md │ └── references/ │ ├── optimization.md │ ├── quantization.md │ ├── server-deployment.md │ └── troubleshooting.md ├── 13-mlops/ │ ├── .gitkeep │ ├── mlflow/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── deployment.md │ │ ├── model-registry.md │ │ └── tracking.md │ ├── swanlab/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── integrations.md │ │ └── visualization.md │ ├── tensorboard/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── integrations.md │ │ ├── profiling.md │ │ └── visualization.md │ └── weights-and-biases/ │ ├── SKILL.md │ └── references/ │ ├── artifacts.md │ ├── integrations.md │ └── sweeps.md ├── 14-agents/ │ ├── .gitkeep │ ├── a-evolve/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── README.md │ │ ├── api.md │ │ ├── architecture.md │ │ ├── design-patterns.md │ │ ├── examples.md │ │ ├── issues.md │ │ ├── releases.md │ │ └── tutorials.md │ ├── autogpt/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── crewai/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── flows.md │ │ ├── tools.md │ │ └── troubleshooting.md │ ├── langchain/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── agents.md │ │ ├── integration.md │ │ └── rag.md │ └── llamaindex/ │ ├── SKILL.md │ └── references/ │ ├── agents.md │ ├── data_connectors.md │ └── query_engines.md ├── 15-rag/ │ ├── .gitkeep │ ├── chroma/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── integration.md │ ├── faiss/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── index_types.md │ ├── pinecone/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── deployment.md │ ├── qdrant/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── sentence-transformers/ │ ├── SKILL.md │ └── references/ │ └── models.md ├── 16-prompt-engineering/ │ ├── .gitkeep │ ├── dspy/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── examples.md │ │ ├── modules.md │ │ └── optimizers.md │ ├── guidance/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── backends.md │ │ ├── constraints.md │ │ └── examples.md │ ├── instructor/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── examples.md │ │ ├── providers.md │ │ └── validation.md │ └── outlines/ │ ├── SKILL.md │ └── references/ │ ├── backends.md │ ├── examples.md │ └── json_generation.md ├── 17-observability/ │ ├── .gitkeep │ ├── langsmith/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── phoenix/ │ ├── SKILL.md │ └── references/ │ ├── advanced-usage.md │ └── troubleshooting.md ├── 18-multimodal/ │ ├── .gitkeep │ ├── audiocraft/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── blip-2/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── clip/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── applications.md │ ├── cosmos-policy/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── libero-commands.md │ │ └── robocasa-commands.md │ ├── llava/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── training.md │ ├── openpi/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── checkpoints-and-env-map.md │ │ ├── config-recipes.md │ │ ├── pytorch-gotchas.md │ │ ├── remote-client-pattern.md │ │ └── training-debugging.md │ ├── openvla-oft/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── aloha-workflow.md │ │ ├── config-troubleshooting.md │ │ ├── libero-workflow.md │ │ └── paper-and-checkpoints.md │ ├── segment-anything/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ ├── stable-diffusion/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── advanced-usage.md │ │ └── troubleshooting.md │ └── whisper/ │ ├── SKILL.md │ └── references/ │ └── languages.md ├── 19-emerging-techniques/ │ ├── .gitkeep │ ├── knowledge-distillation/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── minillm.md │ ├── long-context/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── extension_methods.md │ │ ├── fine_tuning.md │ │ └── rope.md │ ├── model-merging/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── evaluation.md │ │ ├── examples.md │ │ └── methods.md │ ├── model-pruning/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── wanda.md │ ├── moe-training/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── architectures.md │ │ ├── inference.md │ │ └── training.md │ └── speculative-decoding/ │ ├── SKILL.md │ └── references/ │ ├── lookahead.md │ └── medusa.md ├── 20-ml-paper-writing/ │ ├── academic-plotting/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── data-visualization.md │ │ ├── diagram-generation.md │ │ └── style-guide.md │ ├── ml-paper-writing/ │ │ ├── SKILL.md │ │ ├── references/ │ │ │ ├── checklists.md │ │ │ ├── citation-workflow.md │ │ │ ├── reviewer-guidelines.md │ │ │ ├── sources.md │ │ │ └── writing-guide.md │ │ └── templates/ │ │ ├── README.md │ │ ├── aaai2026/ │ │ │ ├── README.md │ │ │ ├── aaai2026-unified-supp.tex │ │ │ ├── aaai2026-unified-template.tex │ │ │ ├── aaai2026.bib │ │ │ ├── aaai2026.bst │ │ │ └── aaai2026.sty │ │ ├── acl/ │ │ │ ├── README.md │ │ │ ├── acl.sty │ │ │ ├── acl_latex.tex │ │ │ ├── acl_lualatex.tex │ │ │ ├── acl_natbib.bst │ │ │ ├── anthology.bib.txt │ │ │ ├── custom.bib │ │ │ └── formatting.md │ │ ├── colm2025/ │ │ │ ├── README.md │ │ │ ├── colm2025_conference.bib │ │ │ ├── colm2025_conference.bst │ │ │ ├── colm2025_conference.sty │ │ │ ├── colm2025_conference.tex │ │ │ ├── fancyhdr.sty │ │ │ ├── math_commands.tex │ │ │ └── natbib.sty │ │ ├── iclr2026/ │ │ │ ├── fancyhdr.sty │ │ │ ├── iclr2026_conference.bib │ │ │ ├── iclr2026_conference.bst │ │ │ ├── iclr2026_conference.sty │ │ │ ├── iclr2026_conference.tex │ │ │ ├── math_commands.tex │ │ │ └── natbib.sty │ │ ├── icml2026/ │ │ │ ├── algorithm.sty │ │ │ ├── algorithmic.sty │ │ │ ├── example_paper.bib │ │ │ ├── example_paper.tex │ │ │ ├── fancyhdr.sty │ │ │ ├── icml2026.bst │ │ │ └── icml2026.sty │ │ └── neurips2025/ │ │ ├── Makefile │ │ ├── extra_pkgs.tex │ │ ├── main.tex │ │ └── neurips.sty │ ├── presenting-conference-talks/ │ │ ├── SKILL.md │ │ └── references/ │ │ └── slide-templates.md │ └── systems-paper-writing/ │ ├── SKILL.md │ ├── references/ │ │ ├── checklist.md │ │ ├── reviewer-guidelines.md │ │ ├── section-blueprints.md │ │ ├── systems-conferences.md │ │ └── writing-patterns.md │ └── templates/ │ ├── asplos2027/ │ │ ├── main.tex │ │ └── references.bib │ ├── nsdi2027/ │ │ ├── main.tex │ │ ├── references.bib │ │ └── usenix-2020-09.sty │ ├── osdi2026/ │ │ ├── main.tex │ │ ├── references.bib │ │ └── usenix-2020-09.sty │ └── sosp2026/ │ ├── main.tex │ └── references.bib ├── 21-research-ideation/ │ ├── brainstorming-research-ideas/ │ │ └── SKILL.md │ └── creative-thinking-for-research/ │ └── SKILL.md ├── 22-agent-native-research-artifact/ │ ├── compiler/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── ara-schema.md │ │ ├── exploration-tree-spec.md │ │ └── validation-checklist.md │ ├── research-manager/ │ │ ├── SKILL.md │ │ └── references/ │ │ ├── event-taxonomy.md │ │ ├── provenance-tags.md │ │ └── session-protocol.md │ └── rigor-reviewer/ │ ├── SKILL.md │ └── references/ │ └── review-dimensions.md ├── CITATION.cff ├── CLAUDE.md ├── CONTRIBUTING.md ├── LICENSE ├── README.md ├── WELCOME.md ├── anthropic_official_docs/ │ ├── best_practices.md │ └── skills_overview.md ├── demos/ │ ├── README.md │ ├── autoresearch-norm-heterogeneity/ │ │ └── README.md │ ├── autoresearch-rl-brain-scan/ │ │ └── README.md │ └── scientific-plotting-demo/ │ ├── README.md │ └── figures/ │ ├── gen_fig_andes_architecture_gemini.py │ ├── gen_fig_andes_workflow.py │ └── gen_fig_experiment_results.py ├── dev_data/ │ ├── GITHUB_SKILLS_SYNC_SETUP.md │ ├── PROJECT_ANALYSIS.md │ ├── RESEARCH_QUESTIONNAIRE.md │ ├── RESEARCH_QUESTIONNAIRE_PART1.md │ ├── RESEARCH_QUESTIONNAIRE_PART2.md │ ├── RESEARCH_QUESTIONNAIRE_PART3.md │ ├── SCRAPING_STATUS.md │ ├── SKILL_BUILD_PLAN.md │ ├── SKILL_STRUCTURE_VERIFICATION.md │ └── deep_research_report_1.md ├── docs/ │ ├── ROADMAP.md │ ├── SKILL_CREATION_GUIDE.md │ ├── SKILL_TEMPLATE.md │ ├── npm-package-plan.md │ ├── npm-package-ux-mockup.html │ └── writing-assets/ │ ├── ML_paper_guide.md │ └── ml_paper_writing_sources.md ├── package.json ├── packages/ │ └── ai-research-skills/ │ ├── .gitignore │ ├── README.md │ ├── bin/ │ │ └── cli.js │ ├── package.json │ └── src/ │ ├── agents.js │ ├── ascii.js │ ├── index.js │ ├── installer.js │ └── prompts.js └── video-promo/ └── ai-research-skills-promo/ ├── .gitignore ├── package.json ├── remotion.config.ts ├── src/ │ ├── AIResearchSkillsPromo.tsx │ ├── Root.tsx │ ├── components/ │ │ ├── AgentDetection.tsx │ │ ├── CallToAction.tsx │ │ ├── CategorySelection.tsx │ │ ├── InstallProgress.tsx │ │ ├── OrchestraLogo.tsx │ │ ├── StatsDisplay.tsx │ │ ├── SuccessScreen.tsx │ │ └── Terminal.tsx │ └── index.ts └── tsconfig.json