gitextract_egmte1ht/ ├── Arxiv 一周进展报告(大模型方向)/ │ ├── 20241004-20241010/ │ │ ├── TOOLGEN:探索Agent工具调用新范式!.md │ │ ├── TableRAG:让大模型轻松驾驭大规模表格数据.md │ │ ├── 利用 KG-RAG 提升病理解释性能,并保护隐私.md │ │ ├── 精准思考,智能分配算力.md │ │ ├── 重要性采样,解锁Token级偏好对齐.md │ │ └── 零额外推理开销,提升RAG性能!.md │ ├── 20241011-20241017/ │ │ ├── TPO:平民版 OpenAI-O1,思维能力遥遥领先!.md │ │ ├── Talker-Reasoner:继物理和化学后,诺贝尔经济学奖成为新目标?.md │ │ ├── 北大 Parenting 方法登场:参数魔法解锁检索增强语言模型新高度!.md │ │ ├── 打破选择困局:多智能体带你高效选择预训练数据.md │ │ ├── 自回归奖励模型让 LLM 对齐不再困难!.md │ │ └── 谷歌联合CMU提出超强奖励模型,大模型推理能力的新曙光!.md │ ├── 20241018-20241024/ │ │ ├── DeepSeek最新多模态大模型,理解与生成同时遥遥领先!.md │ │ ├── LongRAG:长文本问答的 “超级导航仪”,精准定位答案.md │ │ ├── NetSafe:探秘多智能体网络安全拓扑“攻守道”(1).md │ │ ├── SSO:无需人工标注,自动对齐 LLM!.md │ │ ├── WMA Web Agent:让世界告诉Agent决策有风险需谨慎!.md │ │ └── 普林斯顿大学提出 TreeBoN !大语言模型推理效能「提升秘籍」曝光.md │ ├── 20241025-20241031/ │ │ ├── 2D-DPO:告别“一刀切”!多维度对齐 LLM 偏好.md │ │ ├── AgentStore:智能世界的超级 “App Store”.md │ │ ├── CMU 与普林斯顿大学携手改进 BoN 算法,打破大模型推理时计算效率瓶颈!.md │ │ ├── Flow-DPO:像数学老师一样思考!多智能体推理链自动生成.md │ │ └── PULSE 多模态大模型读懂你的心٨ـﮩ٨ـ🖤ﮩ.md │ ├── 20241101-20241107/ │ │ ├── Adapting While Learning:自适应使用智能工具助力科学探索.md │ │ ├── SCPO:Meta 提出大模型自我进化新方法,突破复杂推理能力.md │ │ ├── StepAgent:从小白到大神,过程奖励助力 Agent 进化.md │ │ ├── 谷歌出品 SLED 解码技术,让大语言模型输出更靠谱!.md │ │ └── 颠覆Transformer,神经网络自演化的开端!!!1.md │ ├── 20241108-20241114/ │ │ ├── IOPO:化身超级助手,让 LLM 轻松应对复杂指令.md │ │ ├── Spider 2.0 来袭!大语言模型能否应对企业级 Text-to-SQL 的超强挑战?.md │ │ └── UC Berkeley 和 CMU 出手!揭开大语言模型泛化的 “神秘面纱”.md │ ├── 20241115-20241121/ │ │ ├── LPO:“智能控温”,自适应调整 LLM 解码温度.md │ │ ├── XiYan-SQL:突破性Text-to-SQL框架,准确率遥遥领先!.md │ │ └── 一键自动化:Claude 3.5与GUI Agent的破晓时刻.md │ ├── 20241206-20241212/ │ │ ├── Coconut 从语言脑到推理脑,大模型连续潜在空间推理.md │ │ ├── RARE 登场:大模型推理的 “智慧导航仪”,精准穿越知识迷宫.md │ │ ├── VisionZip压缩视觉token,提升视觉模型推理效率.md │ │ └── 迈向高效智能:大语言模型的能力密度增长与密度定律.md │ ├── 20241213-20241219/ │ │ ├── Meta 提出大概念模型(LCM),突破词级限制的多语言多模态大语言模型.md │ │ ├── ModernBERT:革新编码器模型,引领高效长上下文处理新时代.md │ │ ├── RetroLLM:检索生成大融合,“鹰眼”精准定位答案.md │ │ ├── SHAD+RFT:面向Agent-Task的大模型微调新范式.md │ │ ├── Think&Cite:让 LLM 不再“空口无凭”,句句有出处.md │ │ ├── 大语言模型的 “幻觉克星” 来了!DePaC 助力精准生成.md │ │ ├── 强强联合,Meta与斯坦福发布最新视频大模型Apollo:揭示扩展一致性新规律.md │ │ └── 腾讯提出Cal-DPO,解决DPO重大缺陷.md │ ├── 20241220-20241226/ │ │ ├── GME:打破模态界限,全新通用多模态检索器的探索与突破.md │ │ ├── Mulberry:多模型合作MCTS,让MLLM进入o1推理时代.md │ │ ├── Proactive Agent:主动读取需求,让AI比你更懂你.md │ │ ├── RobustRF:打造鲁棒微调框架,大幅提升大模型在噪声环境下的性能.md │ │ ├── 大语言模型的 “省钱秘籍”!TALE 框架让推理成本大瘦身.md │ │ └── 英伟达和高校联合提出数据选择策略,大幅强化模型预训练效果.md │ ├── 20241227-20250102/ │ │ ├── CCoT压缩链式思维框架,极大降低 CoT 计算开销.md │ │ ├── 任务偏好优化:多模态大语言模型的精细视觉任务革命.md │ │ ├── 减少不必要的计算开销,让模型不再“过度思考”.md │ │ └── 大模型 “进化密码”:加权偏好优化弥补自身短板.md │ └── 20250103-20250109/ │ ├── LLaVA-Mini:压缩至一个视觉token,高效计算与实时响应的多模态大模型.md │ ├── PPT 生成革命!PPTAgent:AI 帮你一键搞定高质量演示文稿,设计、内容、逻辑全搞定!.md │ ├── 微软提出rStar-Math,7B小模型数学能力直逼o1!.md │ └── 陈丹琦团队新作 MeCo,元数据条件化加速模型预训练.md ├── Foundations_of_LLMs(English_version)/ │ └── readme.md ├── LICENSE.md ├── readme.md └── 大模型经典论文列表/ └── readme.md