Archive

2025 ⁶⁹⁶

十一月 ⁵⁰

在线梯度变化如何在 Hölder 平滑性下解锁通用加速

2025-11 · 11 分钟 · 5422 字

EraseFlow：通过引导去噪轨迹擦除不需要的概念

2025-11 · 16 分钟 · 7811 字

当建议有用时：用不完美预测学习乘积分布

2025-11 · 12 分钟 · 5706 字

你需要多少自适应性？理解按需采样中的样本—轮次权衡

2025-11 · 13 分钟 · 6219 字

FlowFeat：教图像记住运动 — 高分辨率、运动感知的像素特征

2025-11 · 15 分钟 · 7388 字

揭开置信：KLASS 如何加速并稳定掩码扩散采样

2025-11 · 12 分钟 · 5654 字

从照片到物理：URDF-Anything 如何用 3D MLLM 构建可执行的数字孪生

2025-11 · 17 分钟 · 8241 字

超越偏好：AI 模型是否理解我们最深层的价值观？

2025-11 · 19 分钟 · 9418 字

PCA++ — 为什么将特征分散开能使对比式 PCA 对结构化噪声更稳健

2025-11 · 13 分钟 · 6506 字

CTRL-ALT-DECEIT：AI 智能体会破坏你的代码吗？深度解析

2025-11 · 9 分钟 · 4446 字

AI能发现新数学吗？教机器理解数学理论中的“有趣”

2025-11 · 7 分钟 · 3329 字

破解图 Transformer 的密码：统一理论与实践的框架

2025-11 · 10 分钟 · 4619 字

ATHENA：AI 如何融合符号数学与语言来预测你的个人选择

2025-11 · 9 分钟 · 4463 字

更聪明，而非更费力：LeMiCa 如何通过全局思维加速 AI 视频生成

2025-11 · 6 分钟 · 2948 字

更聪明，而非更费力：EPIC 如何教大语言模型选择最佳推理策略

2025-11 · 7 分钟 · 3317 字

解锁鲁棒的 3D 视觉：深入解析 Cycle-Sync

2025-11 · 8 分钟 · 3524 字

超越固定步长：前向曲率匹配如何解锁灵活的 3D 重建

2025-11 · 6 分钟 · 2982 字

快速找到所有优质模型：深入解析 SORTeD

2025-11 · 7 分钟 · 3057 字

解释之前先校准：深度剖析 ReCalX，构建可信赖的 AI

2025-11 · 7 分钟 · 3468 字

FAPEX：以分数阶微积分驯服脑电波，实现通用癫痫预测

2025-11 · 7 分钟 · 3250 字

现实的几何学：通过理解自然图像来检测 AI 生成图像

2025-11 · 6 分钟 · 2574 字

定位的极限：带噪距离查询能（和不能）揭示什么

2025-11 · 7 分钟 · 3485 字

虚拟宽度网络：突破二次瓶颈，扩展 Transformer

2025-11 · 6 分钟 · 2920 字

Depth Anything 3：单个 Transformer 看懂三维世界

2025-11 · 6 分钟 · 2879 字

为什么去噪模型应该真正去噪：深入解读 JiT

2025-11 · 7 分钟 · 3010 字

本地 AI 的崛起：用“每瓦智能”衡量并重塑云端

2025-11 · 7 分钟 · 3332 字

与陪练伙伴一起训练大语言模型：深入解析 RLAC

2025-11 · 7 分钟 · 3034 字

超越记忆：强化学习如何教会大语言模型导航知识

2025-11 · 7 分钟 · 3355 字

LLM 的贝叶斯大脑：提示与激活引导如何塑造模型信念

2025-11 · 6 分钟 · 2746 字

WebVIA：探索、编码并验证交互式网站的 AI 智能体

2025-11 · 9 分钟 · 4033 字

超越静态数据：LoopTool 的自校正循环如何打造更智能的 LLM 代理

2025-11 · 7 分钟 · 3206 字

在梦境中训练机器人：WMPO 如何教机器人从想象的失败中学习

2025-11 · 7 分钟 · 3142 字

思考快，表达准：TiDAR 如何解锁 6 倍 LLM 推理速度

2025-11 · 6 分钟 · 2947 字

大语言模型的钢丝——开发者如何在 AI 编程助手的机遇与风险间取得平衡

2025-11 · 7 分钟 · 3123 字

赋予LLM记忆：生成式语义工作空间如何帮助AI理解故事

2025-11 · 8 分钟 · 3747 字

超越置信度：KLASS 如何利用稳定性解锁更快、更优的扩散模型

2025-11 · 6 分钟 · 2704 字

从谱到信号原则：一个成本仅 8 千美元的小模型如何学会像 AI 巨头一样推理

2025-11 · 6 分钟 · 2998 字

我的AI记得什么？揭示AI记忆中隐藏的幻觉

2025-11 · 8 分钟 · 3646 字

藏于无形：NINJA 攻击如何利用长上下文绕过大语言模型安全机制

2025-11 · 7 分钟 · 3179 字

超越离散思维：SofT-GRPO 如何让 LLM 在连续空间中推理

2025-11 · 5 分钟 · 2250 字

超越上下文窗口：IterResearch 如何教 AI 智能体思考、综合并攻克复杂问题

2025-11 · 8 分钟 · 3625 字

Dr. MAMR：如何让 AI 智能体不再“偷懒”，提升协同推理能力

2025-11 · 7 分钟 · 3182 字

用人工智能解锁数学发现：深入剖析 AlphaEvolve

2025-11 · 11 分钟 · 5111 字

超越智能体级搜索：工具到智能体检索如何为 LLM 系统赋能

2025-11 · 6 分钟 · 2792 字

DreamGym：在合成世界中训练 AI 智能体，以掌控真实世界

2025-11 · 7 分钟 · 3441 字

超越正确答案：深入解读 IMO-Bench，人工智能数学能力的新黄金标准

2025-11 · 7 分钟 · 3345 字

Transformer 能中彩票吗？一项新证明在注意力机制中找到了中奖彩票

2025-11 · 7 分钟 · 3138 字

交叉点：在数据稀缺的世界中，扩散模型如何超越大型语言模型

2025-11 · 8 分钟 · 3665 字

超越视觉：V-Thinker 如何教 AI 与图像交互以实现更深层次的推理

2025-11 · 7 分钟 · 3409 字

Sora-2 会思考吗？探索“以视频为思考”的新范式

2025-11 · 7 分钟 · 3362 字

十月 ¹⁵⁹

当直线失效：梯度方差如何揭露整流流中的记忆化

2025-10 · 16 分钟 · 7778 字

TrajMamba 解读：快速、目的感知的车辆轨迹嵌入

2025-10 · 16 分钟 · 7886 字

Teaching Machines to ‘See’ Space: Grid-Based Spatial Intelligence for Autonomous Driving

2025-10 · 14 分钟 · 6646 字

像拼乐高一样拼接计划：C‑MCTD 如何让扩散规划器进行全局思考

2025-10 · 18 分钟 · 8955 字

Diff-ABFlow — 用帧+事件融合与扩散解决模糊与夜间光流

2025-10 · 15 分钟 · 7345 字

一步到位：岭提升如何同时实现稳健性与半参数效率

2025-10 · 13 分钟 · 6074 字

教会模型选择性地遗忘：视觉-语言模型的近似领域遗忘

2025-10 · 15 分钟 · 7493 字

读懂（驾驶者的）思维：使用注意力感知的逆向规划从动作推断注意力偏差

2025-10 · 17 分钟 · 8413 字

拉伸表示：最小生成树如何帮助自监督学习

2025-10 · 17 分钟 · 8070 字

当人们只在意少数选项时：使用广义 Top-k Mallows 模型进行采样、选择与学习

2025-10 · 14 分钟 · 6662 字

扰动输入，而非参数 — 在上下文赌博机中的特征扰动

2025-10 · 9 分钟 · 4458 字

SGD 如何学习最优传输映射：投影 SGD、受限强凸性与极小-极大速率

2025-10 · 14 分钟 · 6724 字

GSAC 解析：因果性与局部性如何使多智能体 RL 可扩展且快速自适应

2025-10 · 11 分钟 · 5123 字

角度引导 — 旋转 LLM 激活以引导行为：直观深入解析

2025-10 · 17 分钟 · 8024 字

为智能体照亮世界：ESCA 如何用场景图为具身 AI 提供落地感

2025-10 · 16 分钟 · 7652 字

2025-10 · 13 分钟 · 6336 字

夺回剪枝带走的东西：通过缺失组件补偿恢复LLM（RestoreLCC）

2025-10 · 11 分钟 · 5407 字

看见并说明原因：DEXTER 如何在无数据情况下结合扩散与大模型解释视觉模型

2025-10 · 12 分钟 · 5532 字

保留有效部分，修正其余：迁移学习如何帮助最小范数插值器泛化

2025-10 · 12 分钟 · 5705 字

更锋利的隐私之剑——f-DP 如何在去中心化网络中释放更强大的 AI

2025-10 · 7 分钟 · 3340 字

用经典统计学解锁稳健的 LLM 水印检测

2025-10 · 6 分钟 · 2916 字

OnlineSplatter：为运动世界打造的实时三维视觉

2025-10 · 7 分钟 · 3371 字

超越事实：LLM 如何将知识压缩为可复用的“属性”

2025-10 · 7 分钟 · 3277 字

Head Pursuit：揭示并编辑 AI 模型内部的“概念旋钮”

2025-10 · 7 分钟 · 3207 字

为什么公平的系统会造成不公平的结果——深入探讨感知偏见

2025-10 · 10 分钟 · 4776 字

我的机器人试图打开一个锁着的抽屉：为什么大语言模型需要面对现实

2025-10 · 7 分钟 · 3505 字

超越静态场景：ROGR如何利用AI在任何环境中重照明3D对象

2025-10 · 7 分钟 · 3145 字

那是你的模型吗？用“重写本”式记忆证明 AI 的身世

2025-10 · 7 分钟 · 3008 字

为什么更多通信有助于（但无法完全解决）去中心化学习：理解多步 Gossip

2025-10 · 7 分钟 · 3202 字

HEDGE已是最佳选择？——深入探讨组合在线学习

2025-10 · 8 分钟 · 3739 字

驯服长尾：深入解析信息保持的两阶段学习

2025-10 · 7 分钟 · 3333 字

旋度下降：当“横向移动”能帮助神经网络更快学习时

2025-10 · 8 分钟 · 3562 字

解锁大脑‘黑箱’：雅可比矩阵如何揭示非线性视觉处理

2025-10 · 8 分钟 · 3572 字

EPHAD：让异常检测从真实世界的数据污染中获救

2025-10 · 7 分钟 · 3186 字

驯服延迟怪兽——当反馈姗姗来迟时的智能决策

2025-10 · 7 分钟 · 3167 字

从分数到谱分布：补全不确定知识图谱的新方法

2025-10 · 7 分钟 · 3020 字

AI 的大脑 GPS：网格状编码如何构建更智能的世界模型

2025-10 · 7 分钟 · 3419 字

消失于无形：深入解析针对 SAM2 的对抗攻击

2025-10 · 7 分钟 · 3016 字

冗余悖论：掩盖旧数据如何改进时间序列预测

2025-10 · 6 分钟 · 2901 字

超越像素——利用物理定律揭示AI生成视频

2025-10 · 8 分钟 · 3657 字

鱼与熊掌兼得：混合平衡 GFlowNet 如何攻克车辆路径问题

2025-10 · 7 分钟 · 3059 字

教 AI 看你所看：深入解析条件表征学习

2025-10 · 7 分钟 · 3360 字

别那样做！用未来视野和人类直觉教机器人

2025-10 · 7 分钟 · 3069 字

稀疏性的形状：Graphon 如何揭示神经网络剪枝的秘密

2025-10 · 8 分钟 · 3807 字

LLM 黑客攻击的普适定律：用“每查询比特数”衡量安全

2025-10 · 7 分钟 · 3093 字

贝尔曼–詹森差距：解锁强化学习中预测的真正价值

2025-10 · 8 分钟 · 3769 字

超越像素：SegMASt3R 如何精通 3D 感知分割匹配

2025-10 · 7 分钟 · 3466 字

超越精美图片：利用数据增强进行因果推断

2025-10 · 7 分钟 · 3466 字

超越全上下文：Memo 如何为 Transformer 打造更智能、更精简的记忆

2025-10 · 7 分钟 · 3142 字

一个模型应对所有场景：MDReID 如何破解目标重识别中的模态混合与匹配难题

2025-10 · 6 分钟 · 2886 字

超越上下文窗口：Vgent 的图驱动长视频理解方法

2025-10 · 7 分钟 · 3274 字

用“能量”解决复杂难题：人工智能如何学会超越训练数据的推理能力

2025-10 · 7 分钟 · 3269 字

超越 LoRA：利用 StelLA 和几何优化学习更好的子空间

2025-10 · 7 分钟 · 3128 字

ReCon：教扩散模型在“框框”里涂色，实现更好的目标检测

2025-10 · 6 分钟 · 2963 字

DiPro：人工智能如何通过分离信号与噪声来追踪疾病

2025-10 · 7 分钟 · 3123 字

聚类混沌：DynaInfer 如何学习分离和泛化动力系统

2025-10 · 6 分钟 · 2760 字

教脉冲无人机飞行：自适应梯度与“跳跃启动”强化学习

2025-10 · 7 分钟 · 3476 字

流畅动作的秘密：解读用于长运动生成的组合式相位扩散模型

2025-10 · 6 分钟 · 2939 字

Transformer 训练的两阶段：从凝聚到秩坍塌

2025-10 · 7 分钟 · 3447 字

填补泛化理论的漏洞——随机投影与压缩如何修复 CMI 界

2025-10 · 9 分钟 · 4444 字

超越平面世界：利用 HyperET 在双曲空间中训练更智能的多模态 AI

2025-10 · 7 分钟 · 3212 字

噪声究竟如何扭曲你的数据？以更锐利的视角审视低秩近似

2025-10 · 7 分钟 · 3370 字

你的数据“形状”有多脆弱？深入探索噪声下的低秩近似

2025-10 · 7 分钟 · 3193 字

万物皆热核：统一组合贝叶斯优化的狂野西部

2025-10 · 7 分钟 · 3251 字

FunLoRA：让 AI 永远学习而不遗忘的巧妙技巧

2025-10 · 7 分钟 · 3261 字

抛弃键与值：通往终身学习的极简主义之路

2025-10 · 7 分钟 · 3317 字

解码上下文学习：为什么 Transformer 可能是隐藏的贝叶斯统计学家

2025-10 · 7 分钟 · 3219 字

超越对错：教LLM判断自身置信度

2025-10 · 7 分钟 · 3096 字

超越百万词元：为长上下文大语言模型构建真实测试与真实记忆

2025-10 · 8 分钟 · 3594 字

超越文本：强化学习与工具如何打造更智能的 LLM 评委

2025-10 · 7 分钟 · 3226 字

从原始计算机到超人 AI：情境工程的隐藏历史与未来

2025-10 · 8 分钟 · 3566 字

超越集合通信：TransferEngine 如何为现代大语言模型解锁可移植的高速通信

2025-10 · 7 分钟 · 3290 字

LLM 微调不稳定的真正罪魁祸首？可能是你的浮点数。

2025-10 · 8 分钟 · 3730 字

Agent Data Protocol：训练更智能 LLM 智能体的通用翻译器

2025-10 · 7 分钟 · 3420 字

AI 们为何意见不合？压力测试它们背后的规则手册

2025-10 · 7 分钟 · 3434 字

超越顺序思维：基于图的规划如何为 LLM 智能体解锁并行能力

2025-10 · 7 分钟 · 3138 字

你的AI懂了吗？一项新的全球基准如何测试116种语言的AI常识

2025-10 · 9 分钟 · 4426 字

提出、解决、评判：单一 LLM 如何通过自我进化学会推理

2025-10 · 6 分钟 · 2912 字

AgentFold：通过整理工作空间，让 AI 像人类一样思考

2025-10 · 7 分钟 · 3392 字

芯片上的衔尾蛇：循环语言模型如何学会“更深”而非“更广”地思考

2025-10 · 9 分钟 · 4463 字

超越模仿：使用 PORTool 教会大语言模型探索与推理工具

2025-10 · 7 分钟 · 3241 字

超越模仿：用监督强化学习教大语言模型进行分步推理

2025-10 · 7 分钟 · 3103 字

超越思维链：异步思考如何解锁协作式人工智能

2025-10 · 6 分钟 · 2851 字

OmniX：利用 AI 将单张图像转变为可交互的 3D 世界

2025-10 · 7 分钟 · 3154 字

ORCA：如何用图像生成器教机器人

2025-10 · 6 分钟 · 2985 字

隆重推出 AMO-Bench：AI 数学推理的全新试炼场

2025-10 · 7 分钟 · 3192 字

Emu3.5：十年视频训练如何教会 AI 理解我们的世界

2025-10 · 10 分钟 · 4701 字

超越 Softmax：Kimi Linear 如何重新定义大语言模型的效率与性能

2025-10 · 8 分钟 · 3696 字

AutoDeco：教语言模型自我引导，无需手动调参

2025-10 · 7 分钟 · 3014 字

头碰头：简单的头间通信如何改进 Transformer 模型

2025-10 · 6 分钟 · 2688 字

超越检索：E²RANK 如何将文本嵌入模型变为强大的重排器

2025-10 · 7 分钟 · 3388 字

超越重建：IGGT 如何让 AI 像人类一样理解三维场景

2025-10 · 8 分钟 · 3641 字

追逐幻影：‘前瞻锚定’如何解决 AI 生成视频中的身份漂移问题

2025-10 · 7 分钟 · 3020 字

FARMER：用自回归流播下下一代图像生成的种子

2025-10 · 4 分钟 · 1619 字

从助手到自主科学家：数据智能体未来发展的六级指南

2025-10 · 9 分钟 · 4150 字

ReCode：统一规划与行动，打造更智能、更具适应性的 AI 智能体

2025-10 · 6 分钟 · 2883 字

超越平面世界：Concerto如何通过融合视觉与触觉教机器看懂3D

2025-10 · 6 分钟 · 2920 字

解锁 AI 视频的创意控制：深入解析 Video-As-Prompt (VAP) 框架

2025-10 · 7 分钟 · 3283 字

DeepAgent：教会 AI 自主思考、发现工具并独立解决复杂问题

2025-10 · 7 分钟 · 3396 字

超越简单滤镜：Pico-Banana-400K 如何训练更智能的 AI 图像编辑器

2025-10 · 7 分钟 · 3126 字

WorldGrow：逐块构建无限、逼真的3D世界

2025-10 · 7 分钟 · 3360 字

打破错误级联：ReDiff 如何教会 AI 纠正自身错误

2025-10 · 6 分钟 · 2826 字

从“步”到“块”：强化学习如何让 AI 图像生成更智能

2025-10 · 7 分钟 · 3163 字

超越准确率：深入剖析 HAL，AI 智能体评估的新标准

2025-10 · 9 分钟 · 4273 字

HERO：融合稀疏规则与密集奖励，增强 LLM 的推理能力

2025-10 · 7 分钟 · 3119 字

Dr.LLM 简介：通过动态层路由升级 LLM，实现更高准确率与更低计算量

2025-10 · 7 分钟 · 3336 字

Elastic-Cache：通过重新思考 KV 缓存，让扩散大语言模型快如闪电

2025-10 · 6 分钟 · 2816 字

AI 团队协作的秘密：揭示 LLM 智能体中的涌现协同效应

2025-10 · 7 分钟 · 3207 字

如何训练更聪明的 AI 智能体：深入解析智能体强化学习

2025-10 · 7 分钟 · 3317 字

从艺术到科学：扩展大型语言模型强化学习的原则性指南

2025-10 · 7 分钟 · 3181 字

超越黑箱：可控 AI 智能体如何革新企业研究

2025-10 · 8 分钟 · 3637 字

Prompt-MII：教大语言模型自己写指令，推理成本降低 13 倍

2025-10 · 7 分钟 · 3175 字

超越自动化：ColorAgent 如何将你的手机 AI 变为真正的伙伴

2025-10 · 7 分钟 · 3355 字

Ring-1T：走进重新定义推理的万亿参数 AI 内部

2025-10 · 7 分钟 · 3007 字

窥探未来：‘Lookahead 路由’如何让大模型做出更智能的选择

2025-10 · 7 分钟 · 3430 字

解锁你 LLM 的隐藏天赋：无需训练

2025-10 · 7 分钟 · 3025 字

修复 LLM 的遗忘症：深入解析稀疏记忆微调

2025-10 · 6 分钟 · 2989 字

AI 也会得“脑腐”吗？垃圾数据如何让大语言模型变笨

2025-10 · 7 分钟 · 3064 字

QeRL：将量化噪声转化为推理型 LLM 的超能力

2025-10 · 7 分钟 · 3070 字

超越 VAE：表征自编码器成为扩散 Transformer 的新默认方案

2025-10 · 6 分钟 · 2703 字

超越视觉与听觉：深入解析 OmniVinci 的全模态 AI

2025-10 · 7 分钟 · 3191 字

Nano3D：无需训练或掩码，轻松实现一致的3D编辑

2025-10 · 8 分钟 · 3581 字

BLIP3o-NEXT：混合式 AI 架构如何重新定义图像生成与编辑

2025-10 · 6 分钟 · 2974 字

LightsOut：AI 如何通过绘制不存在之物在黑暗中视物

2025-10 · 7 分钟 · 3234 字

Skyfall-GS: 用 AI 从太空构建沉浸式 3D 城市

2025-10 · 7 分钟 · 3301 字

Ditto 与 Editto：百万合成视频如何革新 AI 视频编辑

2025-10 · 7 分钟 · 3081 字

几个坏例子如何带坏一个大语言模型：上下文学习的隐藏危险

2025-10 · 6 分钟 · 2742 字

告别 VAE：自监督特征如何为扩散模型强势赋能

2025-10 · 7 分钟 · 3173 字

更智能、更快速、更强大：一种全新的 LLM 推理理论框架

2025-10 · 7 分钟 · 3067 字

无用功：DeepPrune 如何将大语言模型推理成本削减超过 80%

2025-10 · 6 分钟 · 2949 字

不止于正确：为什么你的 AI 编程助手需要一次“感觉检查”

2025-10 · 7 分钟 · 3154 字

学会学习，一次一批：深入解析迭代式摊销推断

2025-10 · 6 分钟 · 2810 字

HyperAdaLoRA：由超网络驱动的升级，实现更快、更智能的 LLM 微调

2025-10 · 6 分钟 · 2804 字

超越思维链：并行思考与自我优化如何解锁更智能的 LLM

2025-10 · 7 分钟 · 3289 字

AgentFlow：训练大语言模型智能体高效思考、规划与使用工具

2025-10 · 7 分钟 · 3415 字

教 AI 思考、回溯和重试：深入解读 MM-HELIX

2025-10 · 5 分钟 · 2372 字

超越模仿：早期经验如何让智能体从自身错误中学习

2025-10 · 8 分钟 · 3913 字

MemMamba：教 AI“记笔记”，攻克超长序列难题

2025-10 · 7 分钟 · 3313 字

超越第一帧：介绍用于任意视频创作的 VideoCanvas

2025-10 · 7 分钟 · 3075 字

DreamOmni2：教 AI 用文字和图片编辑与创作图像

2025-10 · 7 分钟 · 3116 字

超越文本到视频：UniVideo 如何统一理解、生成与编辑

2025-10 · 7 分钟 · 3291 字

MASA：教AI模型‘思考自己的思考’

2025-10 · 6 分钟 · 2564 字

超越更长上下文：教长上下文语言模型用可复用推理进行思考

2025-10 · 6 分钟 · 2813 字

推理火花：微小概率如何解锁 AI 的超强解题能力

2025-10 · 5 分钟 · 2502 字

ARTDECO：融合 SLAM 与基础模型，打造完美的即时 3D 世界

2025-10 · 6 分钟 · 2524 字

受大脑启发的 AI：人工海马体网络如何赋予大语言模型长期记忆

2025-10 · 6 分钟 · 2677 字

为什么 AI 助手是糟糕的模拟用户——以及“翻转对话”如何解决这个问题

2025-10 · 7 分钟 · 3028 字

忘掉像素，生成代码：深入解读 Code2Video 如何创作教育视频

2025-10 · 6 分钟 · 2652 字

一个智能体很好，十个更好：扩展策略如何解锁AI计算机助手的近人类性能

2025-10 · 6 分钟 · 2968 字

少即是多：微型递归网络如何在复杂谜题上超越巨型 AI 模型

2025-10 · 7 分钟 · 3111 字

人工智能领域的龟兔赛跑：渐进式学习如何让视觉 AI 更快

2025-10 · 6 分钟 · 2601 字

RECAP：通过展示有缺陷的推理来教 AI 批判性思考

2025-10 · 6 分钟 · 2629 字

中段训练即可满足全部需求：一个 15B 模型如何触及 AI 前沿

2025-10 · 6 分钟 · 2903 字

LongCodeZip：让大语言模型读懂你的整个代码库，还不用花大钱

2025-10 · 6 分钟 · 2539 字

藏于虚空：StealthAttack 如何对 3D 场景进行投毒

2025-10 · 6 分钟 · 2759 字

小而强大：ModernVBERT 如何重新定义视觉文档检索

2025-10 · 3 分钟 · 1423 字

从秒到分钟：Self-Forcing++ 如何教会 AI 生成长视频

2025-10 · 6 分钟 · 2618 字

AI 能战胜华尔街吗？用 STOCKBENCH 在股市中测试 LLM 代理

2025-10 · 5 分钟 · 2505 字

别浪费你的错误：智能经验回放如何解锁大语言模型的推理能力

2025-10 · 6 分钟 · 2722 字

九月 ⁸²

用聪明的干预破解循环：线性非高斯模型的近最优实验设计

2025-09 · 12 分钟 · 5853 字

Neptune-X — 教会视觉模型看见大海：用于更好海事检测的生成数据 + 智能抽样

2025-09 · 14 分钟 · 6651 字

形式胜过含义：大型语言模型如何学会将句法与领域关联

2025-09 · 15 分钟 · 7125 字

移位的后继：为什么跳过几步能让低秩强化学习奏效

2025-09 · 6 分钟 · 2898 字

教单一大模型进行检索与推理：剖析 AceSearcher 的协同自我对弈

2025-09 · 16 分钟 · 7940 字

让流更短：CAR‑Flow 如何让生成模型停止原地打转

2025-09 · 13 分钟 · 6397 字

当预测调参对推断失效时：针对期望条件协方差的去偏与岭回归最优选择

2025-09 · 15 分钟 · 7188 字

进度条来拯救：微小信号如何帮助调度未知作业

2025-09 · 12 分钟 · 5513 字

LSD 与 LSD+：教快速采样器模仿慢而稳的采样器 — 关于离散扩散中可学习采样器蒸馏的温和导览

2025-09 · 11 分钟 · 5406 字

读完整个电影：功能缩放定律、内在时间，以及为什么 Warmup–Stable–Decay 有效

2025-09 · 17 分钟 · 8369 字

让 Do-SHAP 可用：估计量无关的因果解释与快速前缘技巧

2025-09 · 11 分钟 · 5135 字

DexFlyWheel — 将一次演示转化为成千上万类人类的灵巧机器人技能

2025-09 · 12 分钟 · 5938 字

EvoBrain：动态大脑网络如何帮助预测癫痫发作

2025-09 · 7 分钟 · 3382 字

HyPINO：训练一个神经算子，解决所有问题

2025-09 · 7 分钟 · 3462 字

从“整理”到3D场景：MesaTask如何教AI生成任务就绪的环境

2025-09 · 6 分钟 · 2844 字

WeSCon：教AI在句子中切换情感

2025-09 · 7 分钟 · 3170 字

初识 Orochi：驯服生物医学图像处理的多头蛇

2025-09 · 7 分钟 · 3388 字

超越删除：GeoRemover 如何擦除物体及其恼人的阴影

2025-09 · 6 分钟 · 2907 字

超越对角：利用结构化稀疏性释放状态空间模型的全部潜力

2025-09 · 8 分钟 · 3857 字

毒物如何传播：深入剖析大语言模型中的‘病毒感染攻击’

2025-09 · 6 分钟 · 2897 字

搭建通往更优设计的桥梁：ROOT 如何重新定义离线优化

2025-09 · 7 分钟 · 3137 字

从单个视频到 3D 动画木偶：深入解析 Stable Part Diffusion 4D

2025-09 · 7 分钟 · 3301 字

超越自回归：卷积与拒绝机制如何使扩散语言模型更快更流畅

2025-09 · 7 分钟 · 3086 字

GeoSVR：超越高斯溅射，以几何精确的稀疏体素重建表面

2025-09 · 6 分钟 · 3003 字

更少代价，更强隐私：草图如何在联邦学习中放大隐私保护

2025-09 · 9 分钟 · 4310 字

超越表达能力：衡量图神经网络威力的新方法

2025-09 · 8 分钟 · 3927 字

不错过任何一帧：深入解析 StreamForest 面向视频 AI 的事件记忆机制

2025-09 · 7 分钟 · 3136 字

D-Gating：让神经网络更小更快的可微技巧

2025-09 · 7 分钟 · 3059 字

超越利普希茨极限：非线性预处理如何帮助我们逃离鞍点

2025-09 · 7 分钟 · 3497 字

AI 自噬：为何生成模型正忘记如何创新

2025-09 · 6 分钟 · 2988 字

理解注意力机制：一个兼具速度与可解释性的新框架

2025-09 · 7 分钟 · 3135 字

超越冗余：InfMasking 如何教会 AI 理解协同作用

2025-09 · 7 分钟 · 3129 字

Mamba的盲点：为什么对称性是它的阿喀琉斯之踵

2025-09 · 8 分钟 · 4007 字

Mind the Glitch：AI 终于能够发现并修复生成图像中的不一致之处

2025-09 · 6 分钟 · 2832 字

为蛋白质设计提速：SpecMER 如何利用进化线索更快地生成更好的蛋白质

2025-09 · 7 分钟 · 3326 字

MAESTRO：指挥传感器数据的交响乐，即使乐器失声

2025-09 · 8 分钟 · 3624 字

超越COLMAP：ROS-Cam如何从日常视频中解锁4D场景

2025-09 · 7 分钟 · 3189 字

揭穿 AI 纹理偏见的神话：神经网络究竟如何看待世界

2025-09 · 8 分钟 · 3653 字

破解 GNN 黑箱：GNNXEMPLAR 如何用 AI 以通俗语言解释 AI

2025-09 · 7 分钟 · 3475 字

Transformer AI 的三幕剧：词元如何对齐、聚类与合并

2025-09 · 7 分钟 · 3124 字

重访平坦之地：在混合专家模型的损失地貌中寻找线性连接

2025-09 · 9 分钟 · 4485 字

超越人类反馈：基础模型如何通过 PRIMT 教会机器人

2025-09 · 7 分钟 · 3081 字

Dreamer 4：AI 如何通过做梦学会在《我的世界》中获得钻石

2025-09 · 8 分钟 · 3926 字

大语言模型能像我们一样持续学习吗？深入探讨情境持续学习

2025-09 · 7 分钟 · 3139 字

超越炒作：Kimi-Dev 如何连接人工智能软件工程的两个世界

2025-09 · 7 分钟 · 3121 字

超越 Hessian：深度学习中数据影响的贝叶斯视角

2025-09 · 8 分钟 · 3899 字

AI 智能体准备好迎接真实世界了吗？深入解析 MCPMark 基准测试

2025-09 · 9 分钟 · 4114 字

超越思维链：揭示大语言模型的静默推理

2025-09 · 10 分钟 · 4592 字

ChemMAS：教 AI 像化学家一样推理

2025-09 · 8 分钟 · 3546 字

演化反击：一种出乎意料且强大的 LLM 微调方法

2025-09 · 5 分钟 · 2196 字

龙之幼雏：连接 Transformer 与大脑的新型 AI 架构

2025-09 · 10 分钟 · 4691 字

背包 RL：训练更智能语言模型的一场计算“免费午餐”

2025-09 · 5 分钟 · 2370 字

超越数学谜题：教大语言模型“思考”如何释放卓越的聊天性能

2025-09 · 6 分钟 · 2748 字

初识 ARK-V1：一个能导航知识图谱以实现更智能问答的 LLM 代理

2025-09 · 6 分钟 · 2941 字

LLM能从计算机视觉中学到什么？LLM-JEPA简介

2025-09 · 6 分钟 · 2577 字

教语言模型三思而后行：深入解析 PDDL-INSTRUCT 框架

2025-09 · 5 分钟 · 2476 字

一个分词器统一所有？深入解析 ATOKEN 如何处理图像、视频和 3D

2025-09 · 6 分钟 · 2756 字

超越 ReAct 循环：使用 ARE 和 Gaia2 构建与测试更智能的 AI 智能体

2025-09 · 7 分钟 · 3149 字

AgentScaler：如何通过扩展环境（而非仅仅模型）来解锁高级 AI 智能体

2025-09 · 5 分钟 · 2163 字

抛开炒作：LLM 究竟是在学习还是在记忆？深入探讨上下文学习

2025-09 · 5 分钟 · 2477 字

GP-hy-T：通用物理引擎的黎明？

2025-09 · 6 分钟 · 2568 字

超越谷歌：DeepDive 如何教大语言模型成为专家级研究员

2025-09 · 6 分钟 · 2701 字

K2-THINK：320亿参数模型如何越级挑战AI巨头

2025-09 · 5 分钟 · 2301 字

在刀尖上平衡：人工智能如何发现流体动力学中难以捉摸的奇点

2025-09 · 7 分钟 · 3376 字

超越多数原则：训练大语言模型从多个猜测中综合出最佳答案

2025-09 · 6 分钟 · 2752 字

当多个 AI 大脑不如一个：AI 辩论的隐藏危险

2025-09 · 6 分钟 · 2762 字

打破大语言模型的“隧道视野”：深入解读 ParaThinker 的并行推理

2025-09 · 6 分钟 · 2938 字

实践出真知：AgentGym-RL 如何教大语言模型解决真实世界问题

2025-09 · 6 分钟 · 2809 字

超越“足够好”：ACE-RL 如何教大语言模型掌握长文本写作

2025-09 · 6 分钟 · 2726 字

REFRAG：为 RAG 超级加速，首个 token 生成速度提升 30 倍

2025-09 · 6 分钟 · 2545 字

大型语言模型如何学会思考——解析人工智能中的层次化推理

2025-09 · 5 分钟 · 2492 字

超越单尺度：解析 SINQ，实现更好、更快的大语言模型量化

2025-09 · 5 分钟 · 2461 字

超越聊天机器人：强化学习如何打造自主 AI 研究员

2025-09 · 6 分钟 · 2661 字

HuMo: 让文本、图像和语音完美协同的视频生成模型

2025-09 · 6 分钟 · 2853 字

小模型，大突破：VLA-Adapter 如何将机器人大脑缩小 14 倍

2025-09 · 4 分钟 · 1955 字

SAPO：群体智能训练——AI 模型如何通过经验共享加速 94% 学习

2025-09 · 6 分钟 · 2577 字

让AI像研究员一样浏览网页：打造超人类网络代理的两阶段方法

2025-09 · 5 分钟 · 2487 字

逆向推理：让小模型学会像作家一样思考

2025-09 · 6 分钟 · 2697 字

沉默的思考：大语言模型如何在内部进行推理

2025-09 · 7 分钟 · 3113 字

掌控 AI 研究助手:自定义模型与策略

2025-09 · 5 分钟 · 2340 字

Drivelology: 当 AI 遇上「深度废话」

2025-09 · 6 分钟 · 2711 字

UI-TARS-2: 通过强化学习训练AI掌控计算机的四大支柱

2025-09 · 5 分钟 · 2363 字

八月 ²³

DINOZAUR：一个更精简、更可靠的复杂物理神经算子

2025-08 · 6 分钟 · 2969 字

从静态网格到动态动画：深入解析Puppeteer

2025-08 · 8 分钟 · 3933 字

DeltaFlow：一种更智能、更快速的 3D 点云运动感知方法

2025-08 · 6 分钟 · 2669 字

用更少的数据玩转多目标——无标签数据如何驾驭复杂模型

2025-08 · 11 分钟 · 5293 字

你能预测未来吗？如果只能在周二尝试呢？

2025-08 · 8 分钟 · 3779 字

引导机器人重回正轨：深度解析潜在策略屏障

2025-08 · 8 分钟 · 3705 字

一个模型，多种任务：基于算子的 AI 如何同时实现图像修复、去噪和路径规划

2025-08 · 7 分钟 · 3420 字

解码复杂系统：一种用于发现因果循环与隐藏影响的新型人工智能框架

2025-08 · 7 分钟 · 3183 字

OpenCUA：构建能像你一样使用计算机的开源 AI 智能体

2025-08 · 8 分钟 · 3884 字

驯服混沌：信任域如何引导 AI 解决复杂问题

2025-08 · 9 分钟 · 4451 字

杀鸡焉用牛刀：为大语言模型设计智能、成本感知的路由

2025-08 · 8 分钟 · 3533 字

SmallKV：小小助手如何让大语言模型运行得更快、更轻巧

2025-08 · 6 分钟 · 2680 字

DINOZAUR：傅里叶神经算子的更精简、更确定的继任者

2025-08 · 7 分钟 · 3152 字

揭开对抗攻击的面纱：神经网络如何通过叠加态欺骗自己

2025-08 · 6 分钟 · 2996 字

Agent Lightning：训练任何 AI 代理所缺失的一环

2025-08 · 5 分钟 · 2215 字

GPU 的“奇点”已过：欢迎来到多任务时代

2025-08 · 7 分钟 · 3323 字

超越从左到右：介绍 Dream 7B，一款强大的新型扩散式大语言模型

2025-08 · 7 分钟 · 3164 字

WebWatcher：训练 AI 智能体像专业研究员一样看、读、推理

2025-08 · 4 分钟 · 1981 字

考验 AI 智能体：深入 LiveMCP-101 的真实世界挑战

2025-08 · 6 分钟 · 2877 字

PILOT：既会学习又省钱的智能大模型路由

2025-08 · 5 分钟 · 2472 字

搜索的数学极限：为什么完美的AI也无法检索一切

2025-08 · 6 分钟 · 2541 字

rStar2-Agent: 教会 AI 更聪明地思考，而非更冗长地推理

2025-08 · 5 分钟 · 2245 字

AI视觉模型如何学会像人类一样看世界：通往类脑智能的三把钥匙

2025-08 · 5 分钟 · 2180 字

七月 ²⁷

更大确实学得更好：规模如何解锁神经网络的组合泛化

2025-07 · 10 分钟 · 4671 字

从网格到力学：PhysX-3D 如何教会 3D 生成器关注物理

2025-07 · 13 分钟 · 6218 字

Talk2Event — 用事件的语言说话：在异步视觉中将自然语言落地

2025-07 · 14 分钟 · 6835 字

Segment Anything — 在开放世界中：OpenWorldSAM 如何为 SAM2 添加语言和实例感知

2025-07 · 13 分钟 · 6018 字

为什么 BFGS 真正有效：在无强凸性下的全局、仿射不变速率

2025-07 · 11 分钟 · 5396 字

当视觉-语言模型失去线索：探测非局部视觉推理

2025-07 · 12 分钟 · 5597 字

破解多语性诅咒：Meta CLIP 2 如何将 CLIP 扩展到全球网络

2025-07 · 10 分钟 · 4920 字

聆听、观察、移动：AI 如何学习从 3D 声音中生成人体运动

2025-07 · 8 分钟 · 3624 字

超越贪心搜索：释放 AI 研究智能体的力量

2025-07 · 7 分钟 · 3466 字

打破水印的权衡困境：深入解析 SEEK 如何实现强大的 LLM 保护

2025-07 · 7 分钟 · 3185 字

超越“好”与“坏”：清单如何教会大语言模型真正遵循指令

2025-07 · 7 分钟 · 3105 字

随流而动：构建理解运动的 RNN

2025-07 · 7 分钟 · 3163 字

更少数据，更多细节：CLiFT 如何革新神经渲染

2025-07 · 7 分钟 · 3237 字

超越对齐：SIU3R 如何统一三维场景重建与理解

2025-07 · 7 分钟 · 3043 字

初识 Audio Flamingo 3：一款前所未有的全开放人工智能，能听、会想、善聊

2025-07 · 9 分钟 · 4421 字

给 AI 踩刹车：如何控制推理模型的“思考速度”

2025-07 · 6 分钟 · 2643 字

我的模型学对了吗？介绍用于验证神经后验的 CoLT

2025-07 · 7 分钟 · 3264 字

自主掌控的协作式 AI：FLEXOLMO 简介

2025-07 · 7 分钟 · 3315 字

REG：让扩散 Transformer 训练速度提升 63 倍的简单技巧

2025-07 · 6 分钟 · 2587 字

FedCBDR：全局视角与智能缩放如何攻克联邦增量学习中的类别失衡问题

2025-07 · 6 分钟 · 2981 字

ElasticMM 如何大幅缩短 GPT‑4o 等视觉语言模型的等待时间

2025-07 · 7 分钟 · 3024 字

扩展记忆：为什么记忆马赛克 v2 在即时学习方面优于 Transformer

2025-07 · 8 分钟 · 3570 字

FlexOlmo：协作构建强大 AI——无需共享私有数据

2025-07 · 7 分钟 · 3300 字

释放 BFGS 的力量：无需常规假设的快速收敛

2025-07 · 7 分钟 · 3257 字

超越大数据：小而多样的数据集能教会 Transformer 更好地泛化吗？

2025-07 · 11 分钟 · 5368 字

想得越多，问题越多？当额外计算削弱大语言模型鲁棒性时

2025-07 · 7 分钟 · 3077 字

超越猜测：WebShaper 如何以数学精度打造更聪明的 AI 网络智能体

2025-07 · 5 分钟 · 2495 字

六月 ⁹⁶

为什么 ChebNet 值得重返舞台 —— 以及 Stable-ChebNet 如何修复其在长距离任务中的不稳定动力学

2025-06 · 15 分钟 · 7261 字

曲率来拯救：几何如何使高维下的激励探索高效

2025-06 · 13 分钟 · 6175 字

变分学习如何降低锐度：面向贝叶斯训练的稳定性边缘理论友好导览

2025-06 · 10 分钟 · 4990 字

如何以正确的方式增强二次规划：KKT 感知变换与对比预训练

2025-06 · 20 分钟 · 9933 字

教语言模型以3D思维：深入解析 ShapeLLM-Omni

2025-06 · 19 分钟 · 9108 字

G-Memory：教会多智能体团队记忆 — 深入解析用于大型语言模型代理的分层记忆

2025-06 · 23 分钟 · 11254 字

自我强迫视频扩散：教模型与自身错误共存

2025-06 · 15 分钟 · 7469 字

通过观察人类教机器人：面向对象的三维运动场详解

2025-06 · 14 分钟 · 6785 字

解开 Shampoo：为什么校正特征值 —— 而不总是特征基 —— 能修复它的启发式策略

2025-06 · 11 分钟 · 5261 字

让表格会说话：ConTextTab 如何将语义引入表格内上下文学习

2025-06 · 17 分钟 · 8176 字

Comba — 对双线性 RNN 闭环控制以实现快速且节省内存的序列建模

2025-06 · 17 分钟 · 8421 字

AsymGS — 双模型、更优 3D：使 3D Gaussian Splatting 对野外照片更稳健

2025-06 · 15 分钟 · 7229 字

驱赶百万高斯：最优传输如何在不破坏场景的情况下压缩 3D 高斯渲染

2025-06 · 15 分钟 · 7459 字

Uni-LoRA — 一个向量如何重构整个 LLM 的 LoRA

2025-06 · 21 分钟 · 10291 字

当视觉与运动共进化：SViMo 如何生成一致的手–物交互视频与 3D 运动

2025-06 · 10 分钟 · 4718 字

战胜长远博弈：如何通过缩短视窗解锁可扩展的离线强化学习

2025-06 · 11 分钟 · 5386 字

对冲胜者诅咒：防止推理时的奖励劫持

2025-06 · 11 分钟 · 5127 字

从标记到意图：ARIA 如何让强化学习适用于开放式语言动作

2025-06 · 10 分钟 · 4645 字

ALINE：一个学习提出聪明问题并即时更新信念的单一 Transformer

2025-06 · 11 分钟 · 5474 字

从嘈杂零件到组装形状 — 校正点流如何通过生成形状学习位姿

2025-06 · 16 分钟 · 7740 字

广泛思考，周密规划：MAoP 与 Travel‑Sim 如何教会 LLM 规划真实旅行

2025-06 · 13 分钟 · 6322 字

TimeWak — 在刻度上打水印：可追踪、鲁棒的合成时间序列水印

2025-06 · 12 分钟 · 5590 字

在每一个尺度“倾听”大脑：CSBrain 如何将跨尺度时空结构引入 EEG 基础模型

2025-06 · 16 分钟 · 7702 字

Transformer 如何通过借用技能来学习外推：长度泛化迁移解析

2025-06 · 14 分钟 · 6543 字

“约简映射”如何平整损失曲面 — 几何、曲率与更快收敛的温和导览

2025-06 · 11 分钟 · 5295 字

C-MICL：让学得的约束真正安全——面向优化的保形保证

2025-06 · 11 分钟 · 5083 字

当人们进步时：保守分类器如何在会改进的个体面前取胜

2025-06 · 12 分钟 · 5693 字

当记忆变得有创造力：基于 ReLU 的能量如何让联想记忆既能记住又能发明

2025-06 · 9 分钟 · 4054 字

即时修正预测：频谱校准与闪电更新如何让时空预测更稳健

2025-06 · 14 分钟 · 6693 字

BumbleBee：如何用一个大脑教会人形机器人跳舞、拳击和行走

2025-06 · 7 分钟 · 3473 字

更多动态，更少伪影：DenseDPO 如何革新 AI 视频生成

2025-06 · 6 分钟 · 2771 字

你能用迷你 Transformer 搭建一个巨型 Transformer 吗？

2025-06 · 7 分钟 · 3019 字

GNN 对链接的表达能力有多强？一个新框架、基准测试和一个出人意料的答案

2025-06 · 6 分钟 · 2902 字

AI 能设计出更好的 AI 吗？深入了解 Genesys——一个能发现新语言模型的 LLM

2025-06 · 10 分钟 · 4758 字

为什么大型 AI 模型在游戏中会失败：不稳定梯度的隐藏世界

2025-06 · 8 分钟 · 3521 字

我們能證明生成式模型不會抄襲嗎？版權保護的新視角

2025-06 · 8 分钟 · 3611 字

如何让 AI 彻底遗忘：蒸馏的力量

2025-06 · 6 分钟 · 2932 字

视频生成速度提升 5 倍：FPSAttention 如何解锁实时视频扩散

2025-06 · 5 分钟 · 2410 字

ReSim：在一个由安全专家与冒险新手构成的世界中训练自动驾驶汽车

2025-06 · 7 分钟 · 3423 字

认识 UMA：在近五亿个结构上训练的通用原子 AI 模型

2025-06 · 7 分钟 · 3141 字

AI 如何学习三维视觉：深入解析结构化提示与合成世界

2025-06 · 6 分钟 · 2898 字

因果推断自动驾驶：深入解析 CausalPFN

2025-06 · 11 分钟 · 5194 字

破解代码：如何在大型语言模型内部发现和引导概念

2025-06 · 8 分钟 · 3984 字

模型拼接：一种训练与理解语言模型的捷径

2025-06 · 7 分钟 · 3226 字

解锁双层优化：“集合光滑性”如何驯服非光滑问题

2025-06 · 7 分钟 · 3300 字

Transformer 能学会因果关系吗？深入解读 Do-PFN

2025-06 · 7 分钟 · 3266 字

ROBIN：借助扩散模型高飞，实现更快、更精确的物理模拟

2025-06 · 7 分钟 · 3073 字

坏数据也能出好模型：理解环境扩散

2025-06 · 7 分钟 · 3439 字

超越SMILES字符串：TRIDENT的三叉戟方法如何革新分子AI

2025-06 · 8 分钟 · 3674 字

超越 BEV：GaussianFusion 如何重塑自动驾驶的传感器融合

2025-06 · 7 分钟 · 3341 字

一个模型，统御万象：跨模型空间的摊销推断

2025-06 · 7 分钟 · 3474 字

驯服毒蛇 —— 随机性如何在机器学习中战胜目标性攻击

2025-06 · 8 分钟 · 3646 字

修正漂移：DNAEdit 如何实现高保真 AI 图像编辑

2025-06 · 6 分钟 · 2851 字

“分而治之”为何在多智能体 AI 中有效？秘密在于马尔可夫纠缠

2025-06 · 9 分钟 · 4111 字

训练稳定机器人：祖波夫定理如何解锁巨大的吸引域

2025-06 · 7 分钟 · 3392 字

当平坦性失效：解析高维空间中的神经破碎现象

2025-06 · 8 分钟 · 3815 字

超越平均值：在强化学习中评估回报分布的原则化指南

2025-06 · 7 分钟 · 3150 字

Mamba 与 ViT 的结合：折线路径掩码注意力的威力

2025-06 · 7 分钟 · 3082 字

从压缩到清晰：零样本去噪的突破

2025-06 · 7 分钟 · 3292 字

更聪明，而非更费力：无问题微调如何教会大语言模型自适应思考

2025-06 · 4 分钟 · 1578 字

UniSite：以更智能的方式发现结合口袋，革新药物研发

2025-06 · 7 分钟 · 3431 字

SignViP：一种用于生成超逼真手语视频的全新令牌语言

2025-06 · 6 分钟 · 2949 字

为什么你的谱 GNN 可能是盲目的——以及如何修复它

2025-06 · 7 分钟 · 3268 字

随 STARFlow 而动：归一化流会是图像生成的下一个爆点吗？

2025-06 · 7 分钟 · 3183 字

超越单一答案：ProtInvTree 如何利用智能搜索设计更好的蛋白质

2025-06 · 6 分钟 · 2994 字

Hour-LLaVA：教AI“刷剧”并理解长达一小时的视频

2025-06 · 7 分钟 · 3222 字

没有似然？没问题！用 Fisher 得分匹配直接估计梯度

2025-06 · 7 分钟 · 3361 字

利用自由解压缩窥探“不可触及”矩阵的内部

2025-06 · 8 分钟 · 3606 字

UniRelight：深入解析利用扩散模型联合分解与重现视频光照

2025-06 · 7 分钟 · 3209 字

接近未必够好——近似概率建模中的隐藏难题

2025-06 · 7 分钟 · 3198 字

AI 能在三维空间中观察和聆听吗？介绍 SAVVY，一种空间推理新方法

2025-06 · 7 分钟 · 3377 字

梯度的回响：通过打破时间反演对称性训练序列模型

2025-06 · 11 分钟 · 5020 字

另辟蹊径：状态熵如何让强化学习智能体更鲁棒

2025-06 · 7 分钟 · 3219 字

超越无记忆采样：深入解析伴随薛定谔桥采样器

2025-06 · 7 分钟 · 3120 字

MokA：为多模态世界重新思考 LoRA

2025-06 · 7 分钟 · 3007 字

揭穿噪声神话：生成式 AI 泛化学习的真正原理

2025-06 · 8 分钟 · 3937 字

GP-UCB 宝刀未老：为何这个经典的贝叶斯优化算法是近乎最优的

2025-06 · 6 分钟 · 2899 字

少即是多：自压缩网络如何学会忽略冗余层

2025-06 · 6 分钟 · 2803 字

超越像素：教 AI 像医生一样跨 X 射线、心电图和临床文本进行推理

2025-06 · 9 分钟 · 4215 字

超越每日平均：FuXi-Ocean 如何实现每六小时一次的海洋预报

2025-06 · 7 分钟 · 3269 字

统一物理与复杂性：统计学中计算难度的新视角

2025-06 · 8 分钟 · 3905 字

为什么你的 LLM“确定性”输出并非如此——以及如何解决

2025-06 · 8 分钟 · 3662 字

你能唯一地辨识一个神经网络吗？深入探索多项式网络

2025-06 · 7 分钟 · 3404 字

揭开 Transformer 损失景观的秘密

2025-06 · 7 分钟 · 3381 字

PlayerOne：将单张照片变为可交互的自我中心世界

2025-06 · 7 分钟 · 3201 字

架构手术：‘嫁接’技术如何让我们无需从零重训练即可重塑 AI 模型

2025-06 · 8 分钟 · 3552 字

解码黑箱：借助 EvoLM 深度剖析语言模型训练动态

2025-06 · 6 分钟 · 2802 字

为语言模型做 Boosting？别急：为什么组合生成器可能毁掉一切

2025-06 · 8 分钟 · 3681 字

VoxDet：将分割转化为检测，为 3D 场景理解带来“免费午餐”

2025-06 · 7 分钟 · 3084 字

随 STARFlow 而动：归一化流如何在图像生成领域摘星揽月

2025-06 · 2 分钟 · 844 字

重新思考排练：持续学习中何时序列式优于并发式

2025-06 · 9 分钟 · 4054 字

永不止步的学习——深入探索持续强化学习

2025-06 · 9 分钟 · 4495 字

基础模型困于往昔——持续学习能否使其与时俱进？

2025-06 · 7 分钟 · 3202 字

AI 研究助理到底有多强？深入了解 DeepResearch Bench 基准测试

2025-06 · 7 分钟 · 3179 字

教大语言模型如何自我教学：深入解读自适应语言模型（SEAL）

2025-06 · 7 分钟 · 3059 字

超越 Transformer：MesaNet 如何通过实时优化进行上下文学习

2025-06 · 10 分钟 · 4598 字

五月 ¹³⁵

Seeing Surgery in 3D: How OphNet-3D Reconstructs Hands and Tools for Microsurgical Analysis

2025-05 · 16 分钟 · 7844 字

FlashMD — 用长步幅推动分子动力学向前发展

2025-05 · 18 分钟 · 8596 字

从许多小程序构建世界模型：PoE‑World 如何在少量数据下学习预测与规划

2025-05 · 17 分钟 · 8224 字

教通用视觉-语言模型识别手写数学：深入 Uni‑MuMER

2025-05 · 12 分钟 · 5921 字

把跟踪器变成教师：SANSA 如何揭示 SAM2 内部的语义

2025-05 · 15 分钟 · 7402 字

UniVF 与 VF-Bench — 将时序一致性引入视频融合

2025-05 · 13 分钟 · 6323 字

R-AutoEval+：如何信任（并节省数据用于）像 LLM 裁判一样的自动评估器

2025-05 · 12 分钟 · 5916 字

Absolute Zero：教会语言模型学习——在没有任何数据的情况下

2025-05 · 17 分钟 · 8304 字

视觉-语言模型为何在空间任务上绊倒 —— 从认知视角看 VLM 失败（及简单修复）

2025-05 · 16 分钟 · 7581 字

从两种角度看世界：如何将自视和外视结合让视觉-语言模型更聪明

2025-05 · 16 分钟 · 7854 字

保持质量：用于强度守恒生成模型的离散空间扩散

2025-05 · 15 分钟 · 7395 字

将图像提升到球面：来自腕部相机的 SO(3)-等变视觉运动策略

2025-05 · 17 分钟 · 8293 字

当机器做科学：深入 AI-Researcher —— 端到端自主研究者

2025-05 · 13 分钟 · 6204 字

为什么随机积分器的选择决定深度 BSDE 求解器的成败

2025-05 · 13 分钟 · 6035 字

把模糊变成标尺：如何用散焦 + 预训练扩散先验零样本恢复度量深度

2025-05 · 15 分钟 · 7041 字

QHFLOW — 使用等变流匹配学习具对称性的 DFT 哈密顿量分布

2025-05 · 14 分钟 · 6758 字

如何欺骗 LLM 裁判：通过强化学习逆向工程人类偏好

2025-05 · 16 分钟 · 7516 字

为什么巨大学习率有时有效：受控发散、交叉熵与宽度缩放

2025-05 · 9 分钟 · 4436 字

非线性拉普拉斯 — 给 PCA 一个方向性推动以发现更弱信号

2025-05 · 12 分钟 · 5962 字

有用的捷径：选项感知值学习如何修复长时域离线目标强化学习

2025-05 · 10 分钟 · 4827 字

FlashIPA — 让几何感知注意力扩展到数千残基

2025-05 · 16 分钟 · 7665 字

更快迁移、更聪明定价：CM-TDP 如何让新市场向旧市场学习

2025-05 · 12 分钟 · 5551 字

Enigmata：教会 LLM 解谜的实用配方 — 可扩展的逻辑推理训练方案

2025-05 · 11 分钟 · 5021 字

当“更少的语言”更有用：将语言与推理解耦以构建更好的多语言大模型

2025-05 · 15 分钟 · 7193 字

2025-05 · 5 分钟 · 2092 字

可塑性与赋能 —— 信息理论下的主体能动性镜像

2025-05 · 11 分钟 · 5142 字

当模型知道自己正在被测试：探测并引导推理型大模型的“测试意识”

2025-05 · 11 分钟 · 5020 字

在教机器人执行动作时如何保持视觉-语言骨干不被破坏

2025-05 · 17 分钟 · 8103 字

当一个数字不够时：为什么有些决策需要词典序奖励

2025-05 · 10 分钟 · 4814 字

发现隐藏方向：多指标模型的稳健学习与 SQ 下界

2025-05 · 10 分钟 · 4858 字

别等到结尾：用时序一致性训练增量分类器

2025-05 · 8 分钟 · 3873 字

揭开无分类器引导的面纱：均值移动、对比主成分与 CFG 为什么有效

2025-05 · 12 分钟 · 5776 字

2025-05 · 13 分钟 · 6352 字

引导预训练预测器：从贝叶斯视角看提示微调及其局限

2025-05 · 2 分钟 · 562 字

RepoMaster — 教会代理读取、导航并复用 GitHub 仓库

2025-05 · 11 分钟 · 5109 字

CoRL：强化单一模型以精通视觉理解与生成

2025-05 · 12 分钟 · 5828 字

心智融合：InfiFPO 如何让模型通过偏好相互教学

2025-05 · 14 分钟 · 6778 字

如何学习真正鲁棒的半空间：逐步导读

2025-05 · 13 分钟 · 6252 字

教机器人你的洗衣流程：深入解析 DexGarmentLab

2025-05 · 7 分钟 · 3142 字

解锁亚二次方注意力：深入解读 MonarchAttention

2025-05 · 7 分钟 · 3420 字

寻找最佳平衡点：LLM 训练中临界批量大小的新视角

2025-05 · 7 分钟 · 3151 字

“等待”令牌技巧：通过激活控制唤醒语言模型的深层推理能力

2025-05 · 7 分钟 · 3062 字

解锁 2.3 倍速视频 AI：深入解析 Sparse VideoGen2 的语义感知注意力机制

2025-05 · 7 分钟 · 3013 字

超越平均：Best‑of‑K 强化学习如何解锁更难的问题

2025-05 · 7 分钟 · 3107 字

用图结构修复标签偏移：深入解析 GS-B³SE

2025-05 · 7 分钟 · 3082 字

修复视觉 Transformer：寄存器令牌如何清理混乱的特征

2025-05 · 6 分钟 · 2939 字

LoRAShop：您的 AI Photoshop，无需再训练即可组合和编辑概念

2025-05 · 7 分钟 · 3197 字

让小语言模型表现得像大模型：深入解析智能体蒸馏

2025-05 · 2 分钟 · 849 字

超越提示工程：RePS 如何实现对语言模型的精细控制

2025-05 · 7 分钟 · 3220 字

教 AI 探索：LLM 如何让强化学习更智能

2025-05 · 7 分钟 · 3127 字

DiCo：在扩散 Transformer 时代为卷积网络正名

2025-05 · 6 分钟 · 2833 字

重建 vs. 联合嵌入：深入探讨自监督学习领域的重大辩论

2025-05 · 7 分钟 · 3065 字

注意力就是你预测大脑活动所需要的一切

2025-05 · 8 分钟 · 3738 字

核岭回归的鲁棒性如何？深入探讨重尾噪声

2025-05 · 6 分钟 · 2876 字

预算有限的核方法：使用 Nyström 方法驯服协变量偏移

2025-05 · 6 分钟 · 2861 字

发现差异：子模与超模比率问题的统一视角

2025-05 · 8 分钟 · 3525 字

DeLTa：大语言模型如何在不接触你数据的情况下为决策树赋能

2025-05 · 7 分钟 · 3019 字

超越千亿：DeepSeek-V3 如何通过硬件感知设计重新定义大规模 AI

2025-05 · 7 分钟 · 3092 字

赋予 AI 空间感：深入解读 Spatial-MLLM

2025-05 · 7 分钟 · 3064 字

超越从左到右：FUDOKI 与多模态 AI 的未来

2025-05 · 7 分钟 · 3089 字

超越规模：基于梯度的数据多样性如何解锁下一代大语言模型的推理能力

2025-05 · 7 分钟 · 3125 字

FLAME：一步一步教大语言模型开出更安全的“鸡尾酒”处方

2025-05 · 7 分钟 · 3372 字

耳朵 vs. 眼睛：为什么人工智能难以定位声音——以及神经科学如何提供帮助

2025-05 · 8 分钟 · 3611 字

超越单一分数：ARECHO 如何建模复杂的语音质量网络

2025-05 · 9 分钟 · 4400 字

思想链（CoT）为何有效？一项新理论揭示其奥秘

2025-05 · 6 分钟 · 2580 字

PRODVA：一种乐高式的蛋白质功能设计方法

2025-05 · 7 分钟 · 3207 字

信息在传输中丢失：解构大语言模型中的通信瓶颈

2025-05 · 8 分钟 · 3753 字

Transformer Copilot：教大语言模型从自身错误中学习

2025-05 · 9 分钟 · 4508 字

更智能，而非更大：B3 如何通过智能批次构建革新对比学习

2025-05 · 7 分钟 · 3232 字

克隆巨头：低秩克隆如何让小型语言模型的训练速度提升 1000 倍

2025-05 · 6 分钟 · 3002 字

超越4K：GeoLLaVA-8K如何教AI以超高清分辨率从太空看地球

2025-05 · 7 分钟 · 3489 字

告别步数统计：让“达到目标时间”可微，实现更快优化

2025-05 · 7 分钟 · 3234 字

超越最坏情况：离散分布的实例最优私有估计

2025-05 · 9 分钟 · 4442 字

教 AI 编写 DNA：约束强化学习如何设计细胞类型特异性基因开关

2025-05 · 7 分钟 · 3144 字

SageAttention3：利用 FP4 实现 5 倍速注意力，并深入探讨 8 位训练

2025-05 · 7 分钟 · 3017 字

LODGE：用智能高斯泼溅技术将宏大的 3D 世界带到你的手机上

2025-05 · 7 分钟 · 3112 字

为何有些 AI 模型能够扩展？深入探讨尺寸泛化理论

2025-05 · 10 分钟 · 5004 字

超越状态空间模型：结构化线性受控微分方程 (SLiCEs) 如何兼具速度与表达能力

2025-05 · 7 分钟 · 3449 字

引导 AI 畅游互联网：深入解析 WEB-SHEPHERD

2025-05 · 4 分钟 · 1846 字

快赢或慢输：为什么你的 LLM 智能体需要快速思考

2025-05 · 6 分钟 · 2853 字

惊人的协同效应：为什么稀疏MoE模型偏爱推测解码

2025-05 · 7 分钟 · 3342 字

一条适用于机器学习泛化的热力学定律

2025-05 · 8 分钟 · 3620 字

AirRep：在 AI 数据归因中弥合速度与准确性之间的鸿沟

2025-05 · 6 分钟 · 2957 字

驯服噪声猛兽：迭代式过滤如何征服受污染的数据集

2025-05 · 7 分钟 · 3382 字

超越“多少”：用扩散模型揭示神经元编码的内容

2025-05 · 8 分钟 · 3625 字

揭秘 CEI：深入理解其收敛速率

2025-05 · 7 分钟 · 3111 字

超越简单的谷歌搜索：DeepDiver 如何教 LLM 成为专家级研究员

2025-05 · 7 分钟 · 3398 字

多亏了隐藏的偏见，AI 伪造图像检测技术迎来重大升级

2025-05 · 6 分钟 · 2716 字

拼接未来：扩散模型如何解决强化学习中的一个关键挑战

2025-05 · 7 分钟 · 3450 字

打破权衡：兼具快速学习保证的平滑凸损失函数

2025-05 · 7 分钟 · 3344 字

OmniSync：借助扩散 Transformer，为任意视频开启唇形同步新纪元

2025-05 · 6 分钟 · 2949 字

蝙蝠侠也需要罗宾：小小的“AI搭档”如何增强你巨型模型的置信度

2025-05 · 7 分钟 · 3130 字

超越瓶颈：GraLoRA 如何解锁更高秩的微调

2025-05 · 7 分钟 · 3063 字

当数据说谎时：理解 COMPFLOW——在多变世界中训练强化学习的更智能方法

2025-05 · 7 分钟 · 3124 字

条条大路通罗马：利用多样性感知的强化学习提升大语言模型的数学能力

2025-05 · 7 分钟 · 3033 字

D.Va：让机器人学会“看见”与“行动”的捷径——训练时间从数周缩短至数小时

2025-05 · 8 分钟 · 3659 字

SpecEdge：结合云服务器与边缘 GPU，大幅削减 LLM 成本

2025-05 · 7 分钟 · 3043 字

为 AI 临床医生设置“护栏”：深入探讨医疗保健中的安全强化学习

2025-05 · 7 分钟 · 3386 字

超越多数投票：深入解析 CaMVo，打造高性价比的 LLM 标注方案

2025-05 · 7 分钟 · 3226 字

AuroRA：以 8 倍更少的参数实现 LoRA 的 SOTA 性能

2025-05 · 6 分钟 · 2821 字

UMoE：打造更智能、稀疏激活 Transformer 的统一方案

2025-05 · 6 分钟 · 2989 字

InForage：让大语言模型像人类一样搜寻信息

2025-05 · 7 分钟 · 3238 字

超越网格：CALM-PDE 如何利用自适应卷积求解复杂物理问题

2025-05 · 7 分钟 · 3296 字

强化学习能教会大语言模型像医生一样思考吗？深入解析 DRG‑SAPPHIRE

2025-05 · 7 分钟 · 3269 字

该看哪里：PhySense 如何教会 AI 为物理传感器找到最佳位置

2025-05 · 7 分钟 · 3107 字

MeanFlow：单步生成高保真图像

2025-05 · 6 分钟 · 2645 字

解构经验回放：数据归因如何让强化学习更具可解释性和效率

2025-05 · 7 分钟 · 3258 字

超越扁平视频：Dynam3D 如何赋予导航 AI 真正的 3D 空间感

2025-05 · 7 分钟 · 3069 字

破解触觉密码：AI 模型如何学习像啮齿动物一样“感知”

2025-05 · 8 分钟 · 3568 字

智能的几何学：叠加态如何解释大语言模型为何越大越好

2025-05 · 6 分钟 · 2999 字

破解涌现之谜：稀疏注意力与数据重复如何塑造大语言模型的学习

2025-05 · 7 分钟 · 3483 字

超越负载均衡：构建更智能混合专家模型的新方案

2025-05 · 7 分钟 · 3079 字

一次训练，随处运行：深入解析通用车辆轨迹学习模型 TransferTraj

2025-05 · 7 分钟 · 3337 字

超越准确性：一种用于校准高维预测的通用算法

2025-05 · 7 分钟 · 3361 字

陷入瓶颈？几秒钟的“思考”如何彻底改变你的强化学习智能体性能

2025-05 · 6 分钟 · 2663 字

从刚性规则到灵活学习：一种更智能的等变网络训练方法

2025-05 · 6 分钟 · 3005 字

解压 KVzip：如何在不丢失上下文的情况下让大语言模型更快、更轻

2025-05 · 7 分钟 · 3220 字

Adam 的成功秘诀是什么？深入剖析优化器之王

2025-05 · 7 分钟 · 3337 字

通往更智能 LLM 的大门：一个简单技巧如何增强注意力并消除沉溺现象

2025-05 · 6 分钟 · 2808 字

OpenHOI：通过对话，教会AI与任何物体交互

2025-05 · 7 分钟 · 3072 字

OmniSync：开启任意视频（真实或 AI 生成）唇形同步的新纪元

2025-05 · 9 分钟 · 4019 字

LLM 真的智能吗？KORGym 用 50 多款游戏检验其推理能力

2025-05 · 7 分钟 · 3237 字

一次修复一个面：深入解析 Mesh-RFT

2025-05 · 7 分钟 · 3100 字

一个算法统领全局？图与集合优化的统一视角

2025-05 · 8 分钟 · 3872 字

两全其美：知识绝缘如何让机器人更快、更智能

2025-05 · 6 分钟 · 2905 字

BIOREASON：融合 DNA 和语言模型，教 AI 像生物学家一样思考

2025-05 · 7 分钟 · 3432 字

超越静态帧：深入解析 UniVF 实现无闪烁视频融合

2025-05 · 7 分钟 · 3151 字

当场抓获：我们能通过观察 AI 的“思维过程”来识破其欺骗行为吗？

2025-05 · 8 分钟 · 3528 字

解决AI的“失忆症”：超网络与原型如何战胜灾难性遗忘

2025-05 · 6 分钟 · 2865 字

永不遗忘：让 AI 持续学习的可扩展技巧

2025-05 · 7 分钟 · 3081 字

少即是多：通过增强大语言模型的自信来解锁其推理能力

2025-05 · 6 分钟 · 2828 字

循序渐进学逻辑：课程溯因学习如何稳定AI推理

2025-05 · 7 分钟 · 3377 字

Prism：通过更智能的 GPU 共享，大幅削减 LLM 服务成本

2025-05 · 8 分钟 · 3528 字

即时训练：LLM 如何在测试中持续自我提升

2025-05 · 7 分钟 · 3057 字

LaCT：为什么对于测试时训练和长上下文AI，越大越好

2025-05 · 8 分钟 · 3671 字

四月 ²⁸

不教答案也能教会推理：EMPO 如何在无监督下让 LLM 进行推理

2025-04 · 12 分钟 · 5697 字

ReDi：教会扩散模型用特征思考 —— 更快、更智能的图像生成

2025-04 · 11 分钟 · 5243 字

GraphMaster：协调 LLM 代理以合成带文本属性的图

2025-04 · 4 分钟 · 1794 字

可疑的机器人：《Among Us》如何揭示 AI 的欺骗行为

2025-04 · 7 分钟 · 3504 字

Taccel：一款 GPU 加速模拟器，可同时为数千个虚拟机器人带来逼真的触感

2025-04 · 7 分钟 · 3141 字

少即是多：MCTS 引导的数据筛选，解锁视觉语言模型的 SoTA 性能

2025-04 · 7 分钟 · 3207 字

治愈 AI 的“过度思考”：FAST-GRPO 如何教视觉模型快思慢想

2025-04 · 7 分钟 · 3017 字

FramePack：斯坦福与麻省理工学院如何解决 AI 视频生成中的遗忘与漂移问题

2025-04 · 7 分钟 · 3133 字

超越反向传播：去相关误差如何训练神经网络

2025-04 · 8 分钟 · 3842 字

从混沌到相干：扩散模型如何学会绘画

2025-04 · 7 分钟 · 3476 字

揭秘缩放定律：大语言模型如何通过压缩语言进行学习

2025-04 · 10 分钟 · 4567 字

教扩散模型学会推理：深入解读 d1 框架

2025-04 · 3 分钟 · 1454 字

超越复制粘贴：MIGGPT 如何教会大语言模型迁移复杂的内核补丁

2025-04 · 7 分钟 · 3384 字

超越黑盒：PerceptionLM 如何让 AI 视觉研究开放且可复现

2025-04 · 8 分钟 · 3829 字

教会 AI 进行双重检查：VL-Rethinker 如何利用强化学习提升多模态推理能力

2025-04 · 7 分钟 · 3261 字

杂乱数据的惊人优势：深入探究多模态错位

2025-04 · 8 分钟 · 3768 字

寻找万能钥匙：微小子网络如何驱动语言模型预测

2025-04 · 7 分钟 · 3128 字

超越 Softmax：量子电路如何稳定并增强 Transformer 注意力机制

2025-04 · 7 分钟 · 3331 字

解锁隐藏层：感知编码器如何重新定义视觉技术新境界

2025-04 · 11 分钟 · 5393 字

为混乱的离线强化学习理清头绪

2025-04 · 8 分钟 · 3519 字

强化学习让大语言模型更好，但不更聪明：探索人工智能自我提升的极限

2025-04 · 7 分钟 · 3181 字

超越黑盒：PerceptionLM 如何为视觉 AI 构建透明的未来

2025-04 · 9 分钟 · 4089 字

FM-LoRA：让 AI 终身学习而不遗忘

2025-04 · 6 分钟 · 2945 字

即时学习：深入解析神经场的元持续学习

2025-04 · 6 分钟 · 2865 字

超越上下文窗口：MemO 如何赋予 AI 持久记忆

2025-04 · 6 分钟 · 2705 字

BitNet b1.58：重新定义 AI 效率的 1 比特大语言模型

2025-04 · 7 分钟 · 3277 字

Agent S2：AI 专家团队如何掌控你的电脑

2025-04 · 6 分钟 · 2630 字

CoProSketch: 终于有了可以编辑的AI草图生成器

2025-04 · 5 分钟 · 2405 字

三月 ²⁹

DeCaFlow — 使用因果正规化流去混淆：一个模型回答多种因果问题

2025-03 · 10 分钟 · 4748 字

从 (ε, δ) 到 ε：随机后处理如何净化差分隐私

2025-03 · 14 分钟 · 6896 字

Opt-CWM：学会向视频预测器提出更好的问题以提取运动

2025-03 · 11 分钟 · 5137 字

2025-03 · 10 分钟 · 4974 字

三方拉锯战：掌握神经压缩中的码率、失真与感知

2025-03 · 6 分钟 · 2981 字

过度思考的 AI：当“思考”损害模型性能时

2025-03 · 9 分钟 · 4290 字

LLM 的平行世界：探索 FFN 融合与模型效率的未来

2025-03 · 6 分钟 · 2962 字

DiLoCo 的扩展秘密：在无通信瓶颈下训练超大规模语言模型

2025-03 · 7 分钟 · 3298 字

自教式前瞻：LLM 如何在无奖励的情况下更聪明地规划

2025-03 · 7 分钟 · 3507 字

CompDiffuser：通过拼接短期技能教机器人进行长期规划

2025-03 · 7 分钟 · 3134 字

打破对称性，优化化学：深入解析 ELECTRA

2025-03 · 7 分钟 · 3429 字

超越对角：不动点迭代如何解锁稠密 RNN

2025-03 · 8 分钟 · 3571 字

这个 AI 会推理吗？理解神经符号学习的新理论

2025-03 · 7 分钟 · 3244 字

超越评分：Q-Insight 如何教 AI 像摄影师一样“看”

2025-03 · 6 分钟 · 2618 字

更智能，而非更费力：自截断技术如何让大语言模型推理效率提升80%

2025-03 · 8 分钟 · 3774 字

UFO 是真的：语言模型如何学会观察、检测和分割我们的世界

2025-03 · 7 分钟 · 3368 字

超越精美画面：WISA 如何教 AI 学习物理定律

2025-03 · 7 分钟 · 3040 字

Q-FAT：一种无需量化的 Transformer，实现更平滑、更智能的机器人模仿学习

2025-03 · 6 分钟 · 2761 字

扩展强化学习：深度如何释放涌现行为

2025-03 · 7 分钟 · 3042 字

Pan-LUT：利用可学习查找表实现闪电般快速的卫星图像锐化

2025-03 · 6 分钟 · 2752 字

超越对角 RNN：不动点迭代如何释放新的表达能力

2025-03 · 6 分钟 · 2994 字

超越CNN：利用Pan-LUT实现闪电般快速的卫星图像融合

2025-03 · 6 分钟 · 2916 字

聚焦无解之境：如何在联邦学习中实现完美收敛

2025-03 · 7 分钟 · 3251 字

低成本对抗 AI 遗忘症：Replay4NCL 如何实现高效终身学习

2025-03 · 7 分钟 · 3233 字

“顿悟”时刻：揭开大型语言模型（LLM）神秘的涌现能力

2025-03 · 8 分钟 · 3946 字

破解密码：神经网络如何将可解释特征藏于显眼之处

2025-03 · 7 分钟 · 3337 字

DAPO：揭秘强化学习，打造超人级大语言模型推理能力

2025-03 · 6 分钟 · 2983 字

弥合差距：RISE 如何应对基于模拟的推断中的缺失数据

2025-03 · 7 分钟 · 3043 字

按需生成 AI 大脑：ORAL 如何为不断演进的 LLM 打造 LoRA 适配器

2025-03 · 6 分钟 · 2930 字

二月 ⁵²

平衡过去：如何用差异理论压缩长上下文 Transformer 的 KV 缓存

2025-02 · 13 分钟 · 6461 字

AutoToM：让模型去构建模型 —— 可扩展的自动贝叶斯心智理论

2025-02 · 14 分钟 · 6952 字

培育更安全的智能体：AgentBreeder 如何演化多智能体脚手架以提升能力与安全性

2025-02 · 13 分钟 · 6464 字

教机器人重要的方向：语义方向与 SOFAR 系统

2025-02 · 16 分钟 · 7698 字

边玩边学：乐观镜像下降如何让大语言模型更符合人类偏好

2025-02 · 14 分钟 · 6637 字

当标签在说谎 —— SCAM 如何用自监督重新训练时间序列预测

2025-02 · 15 分钟 · 7400 字

KARMA：多智能体大型语言模型如何将科学论文转化为知识图谱

2025-02 · 14 分钟 · 6763 字

DICEPTION — 将文本到图像扩散模型转变为一个覆盖多种感知任务的单一模型

2025-02 · 21 分钟 · 10104 字

从仓库到运行：Repo2Run 如何用 LLM 代理自动化 Docker 环境

2025-02 · 10 分钟 · 4529 字

UniTok — 如何打造一个既能“看”又能“创”的视觉分词器

2025-02 · 12 分钟 · 5830 字

在大规模下驯服异质性：用于弱耦合 MDP 的基于投影的 Lyapunov 方法

2025-02 · 11 分钟 · 5217 字

为什么你的优化器会选择一个间隔：谱下降、Muon 与多类线性分类器的几何学

2025-02 · 11 分钟 · 5422 字

像人一样阅读：VIST 如何教大语言模型略读长文本

2025-02 · 7 分钟 · 3083 字

超越同量测度：一种可扩展的图上非均衡数据比较新方法

2025-02 · 6 分钟 · 2872 字

Twilight：以自适应稀疏性突破大语言模型推理的固定预算限制

2025-02 · 7 分钟 · 3079 字

一个模型即可统领一切：RobustMerge 如何融合专业化 AI 大脑

2025-02 · 7 分钟 · 3154 字

不只是画得好看：在稳定扩散模型中实施硬约束

2025-02 · 7 分钟 · 3399 字

角度校准：一种可被证明最优的高维分类器校准方法

2025-02 · 7 分钟 · 3301 字

在潜在空间中思考：循环式 LLM 如何学会深度推理

2025-02 · 7 分钟 · 3302 字

超越二次复杂度：解析 MoBA，实现超高效长上下文大语言模型

2025-02 · 6 分钟 · 2927 字

少即是多：用智能数据选择加速 LLM 对齐

2025-02 · 6 分钟 · 2898 字

两全其美：一种用于隐私机器学习的新采样方法

2025-02 · 6 分钟 · 2976 字

超越欧几里得空间：生成式 AI 如何通过李群扩散学习对称性

2025-02 · 6 分钟 · 2796 字

超越平均值：复杂金融与科学模型的量子飞跃

2025-02 · 7 分钟 · 3229 字

BevSplat：用 3D 高斯“绘画”从太空精准定位你的位置

2025-02 · 7 分钟 · 3172 字

KL 校准：通往可靠在线预测的更强路径

2025-02 · 6 分钟 · 2917 字

GSRF：溅射无线电波，实现超快速无线仿真

2025-02 · 7 分钟 · 3082 字

超越稳定性边缘：为何任意步长都适用于梯度下降

2025-02 · 8 分钟 · 3698 字

核周采样（Perinucleus Sampling）：在不损害模型的前提下向 LLM 嵌入超过 24,000 个指纹

2025-02 · 7 分钟 · 3286 字

超越直觉：双心智 AI 如何学习用逻辑预测未来

2025-02 · 7 分钟 · 3021 字

对称博弈与最小最大优化中隐藏的复杂性

2025-02 · 7 分钟 · 3291 字

如何利用反事实解释窃取 AI 模型

2025-02 · 7 分钟 · 3117 字

微调不可知学习：深入探究近乎最优的分类

2025-02 · 8 分钟 · 3515 字

GRAPE：通过寻找最匹配的数据，从大语言模型中榨取更多性能

2025-02 · 6 分钟 · 2621 字

征服魔方：人工智能如何打破巨型 5×5×5 魔方谜题的记录

2025-02 · 7 分钟 · 3227 字

标签平滑的隐藏缺陷——MaxSup 来修复

2025-02 · 6 分钟 · 2784 字

为什么模拟 AI 训练会出错：理解并修复非理想阻性器件

2025-02 · 8 分钟 · 3824 字

超越下一个词元预测：挑战大语言模型范式的扩散模型 LLaDA

2025-02 · 6 分钟 · 2968 字

神经网络训练的三个时代：学习、过拟合与遗忘

2025-02 · 9 分钟 · 4435 字

找到正确的角度：一种在高维空间中实现完美校准模型的新方法

2025-02 · 7 分钟 · 3370 字

一个 LoRA 能否统领全局？C-LoRA 终身学习方法介绍

2025-02 · 6 分钟 · 2963 字

超越记忆：Minnow 如何让语言模型即时掌握新词

2025-02 · 9 分钟 · 4493 字

AnyMDP 与 OmniRL：构建能在随机世界中即时学习的 AI 智能体

2025-02 · 7 分钟 · 3336 字

Optimus-2：让 AI 像专家一样玩转 Minecraft 的更智能策略

2025-02 · 7 分钟 · 3319 字

IndexTTS：深入解读 Bilibili 的工业级可控声音克隆系统

2025-02 · 7 分钟 · 3100 字

让大语言模型真正遗忘：更平滑的路径如何化解“失忆恢复”攻击

2025-02 · 7 分钟 · 3369 字

数据策展的艺术：深入探索最先进的小型语言模型 SmolLM2

2025-02 · 8 分钟 · 3774 字

为什么你的可解释 AI 可能在欺骗你：深入剖析联合推理捷径

2025-02 · 8 分钟 · 3659 字

超越 AdamW：Muon 优化器如何让大语言模型训练速度提升两倍

2025-02 · 7 分钟 · 3224 字

别再重复犯错：LLM 如何实时从反馈中学习

2025-02 · 6 分钟 · 2885 字

超越训练循环：用推理时技巧解锁 LLM 的推理能力

2025-02 · 6 分钟 · 2994 字

YOLOv12: 打破CNN垄断的注意力机制实时检测器

2025-02 · 6 分钟 · 2699 字

一月 ¹⁵

超越记忆：DeepSeek-R1 如何教会大语言模型真正地推理

2025-01 · 7 分钟 · 3058 字

2025-01 · 14 分钟 · 6912 字

Wigner 6j 重新耦合如何让等变 Transformer 可扩展：友好的 E2Former 深入解析

2025-01 · 13 分钟 · 6502 字

谨慎花费：为什么你的合成数据集应呈指数增长

2025-01 · 11 分钟 · 5093 字

数据的双螺旋：联合学习样本与特征的层次结构

2025-01 · 9 分钟 · 4394 字

超越高斯过程：用算子流匹配学习任意函数分布

2025-01 · 7 分钟 · 3129 字

脉冲、位置与 Transformer——类脑人工智能中的相对编码新思路

2025-01 · 7 分钟 · 3371 字

超越点积：用张量积注意力压缩大语言模型的内存

2025-01 · 8 分钟 · 3666 字

解读 VITA-1.5：开源社区对实时 AI 视觉与语音的探索

2025-01 · 6 分钟 · 2950 字

SD-LoRA：基础模型如何实现无遗忘的持续学习

2025-01 · 7 分钟 · 3058 字

遇见 Titans：一种能在运行时学习记忆的新型 AI

2025-01 · 7 分钟 · 3383 字

超越金鱼记忆：Zep 的时序知识图谱如何赋予 AI 更智能的大脑

2025-01 · 7 分钟 · 3463 字

为什么你的猫仍然比最先进的人工智能更聪明

2025-01 · 7 分钟 · 3432 字

超越黑箱：深入探索自可解释神经网络

2025-01 · 11 分钟 · 5256 字

超越预训练：大语言模型如何即时重构其‘大脑’

2025-01 · 7 分钟 · 3237 字

2024 ¹²⁰

十二月 ¹²

Mulberry 与 CoMCTS —— 教会多模态大模型协同思考、智能搜索与反思

2024-12 · 16 分钟 · 7736 字

教会 2D 模型理解 3D：一种全新的分子交互预训练策略

2024-12 · 8 分钟 · 3640 字

AlphaZero、齐夫定律与惊人的频率力量

2024-12 · 7 分钟 · 3435 字

驯服蜂群——子采样如何解锁可扩展的多智能体 AI

2024-12 · 10 分钟 · 4635 字

预测未来：TREND 如何让自动驾驶汽车实现四维感知

2024-12 · 6 分钟 · 2837 字

当算法变得不稳定：深入解析 UCB-V 老虎机算法

2024-12 · 7 分钟 · 3068 字

S2P2：重新定义事件序列预测的深度状态空间模型

2024-12 · 7 分钟 · 3311 字

超越固定架构：AI 模型如何通过成长实现终身学习

2024-12 · 7 分钟 · 3304 字

超越小样本：解构语境学习的全貌

2024-12 · 8 分钟 · 3550 字

AI、大脑模型与混乱数据：构建鲁棒的摊销贝叶斯推断

2024-12 · 8 分钟 · 3767 字

TRELLIS：用统一的隐空间结构编织高质量 3D 世界

2024-12 · 6 分钟 · 2530 字

从未见过画作的AI，如何学会艺术创作？

2024-12 · 6 分钟 · 2915 字

十一月 ¹²

当模态竞争：博弈论与互信息如何拯救多模态学习

2024-11 · 11 分钟 · 5397 字

EigenPro 4：用于快速大规模核学习的延迟投影

2024-11 · 13 分钟 · 6321 字

深入机器之心：揭示 LLM 中的推理电路

2024-11 · 7 分钟 · 3189 字

教神经网络思考：潜在程序搜索的力量

2024-11 · 7 分钟 · 3048 字

超越 MAML：一种利用核与梯度协调的更快、更智能的学会学习之道

2024-11 · 7 分钟 · 3086 字

即时学习：深入解析用于持续学习的 Online-LoRA

2024-11 · 8 分钟 · 3509 字

DualLoRA：教视觉 Transformer 新技巧，同时不忘旧知识

2024-11 · 6 分钟 · 2916 字

当模型遇见现实：测试时自适应终极指南

2024-11 · 10 分钟 · 4739 字

训练大语言模型成为自己最严厉的批判者

2024-11 · 8 分钟 · 3770 字

超越提示：揭示大型语言模型中的捷径学习

2024-11 · 7 分钟 · 3354 字

A-BLINK：使用神经网络为高斯过程推理提速

2024-11 · 7 分钟 · 3012 字

为什么 AI 不像我们一样“懂”：对齐人类与机器的泛化方式

2024-11 · 7 分钟 · 3338 字

十月 ²⁰

超越平面国：为什么双曲几何是 LLM 推理的下一个前沿

2024-10 · 6 分钟 · 2883 字

超越均值：一种性能接近最优的不宁腿老虎机新策略

2024-10 · 8 分钟 · 4006 字

教语言模型开车：PLMTrajRec 如何填补 GPS 数据的空白

2024-10 · 7 分钟 · 3291 字

一个任务，多种解法——神经网络如何揭示智能背后隐藏的多样性

2024-10 · 8 分钟 · 3540 字

SSM 的隐藏漏洞：干净数据如何破坏 Mamba、S4 及其同类模型

2024-10 · 9 分钟 · 4208 字

教 AI 像人一样学习：深入解析对比元学习（ConML）

2024-10 · 7 分钟 · 3313 字

Transformer 是可学习的：一种用于线性注意力的多项式时间算法

2024-10 · 6 分钟 · 2887 字

Transformer 可被证明高效学习——至少某些类型可以

2024-10 · 7 分钟 · 3183 字

翻转难题：当对称性成为障碍时，如何确定 3D 模型的朝向

2024-10 · 6 分钟 · 2854 字

超越‘即训即测’：对比学习如何为元学习器赋能

2024-10 · 6 分钟 · 2882 字

超越回合制：OmniFlatten 如何教 AI 进行自然、可被打断的语音对话

2024-10 · 7 分钟 · 3058 字

AI 能看见显而易见的事物吗？为何顶级视觉模型也会在简单推理上失败

2024-10 · 7 分钟 · 3117 字

揭秘扩散模型加速的秘密：AdaptiveDiffusion 如何智能地跳过步骤

2024-10 · 6 分钟 · 2681 字

驯服两大“对手”：鲁棒稀疏回归的突破性进展

2024-10 · 8 分钟 · 3848 字

用随机数据解锁上下文强化学习——深入解析状态-动作蒸馏（SAD）

2024-10 · 7 分钟 · 3255 字

AlphaGateau：利用图表示，更快、更智能地训练国际象棋引擎

2024-10 · 7 分钟 · 3230 字

LLM 如何自我学习，变得更值得信赖

2024-10 · 6 分钟 · 2915 字

ACE：一个统一视觉、优化和科学模拟的 Transformer 模型

2024-10 · 7 分钟 · 3182 字

FLASHMASK：用超高效注意力掩码驾驭长序列

2024-10 · 6 分钟 · 2637 字

可视化故事写作：通过操作交互式故事地图来编辑叙事

2024-10 · 6 分钟 · 2652 字

九月 ⁷

2024-09 · 14 分钟 · 6636 字

HM3：通过强化学习与多目标优化重塑模型合并

2024-09 · 7 分钟 · 3171 字

寻找公平性前沿：无需训练复杂模型即可计算最优权衡

2024-09 · 6 分钟 · 2883 字

AI 可解释性中的隐藏弱点：当特征相互“吸收”时

2024-09 · 8 分钟 · 3823 字

学会关联：任务相似性如何解决元学习的欠拟合问题

2024-09 · 8 分钟 · 3782 字

叠加之困：一个神经元究竟能计算多少个特征？

2024-09 · 7 分钟 · 3079 字

超越静态模型：TTT-UNet如何即时自适应以实现卓越的医学图像分割

2024-09 · 7 分钟 · 3027 字

八月 ²

滤除噪声：深入探究用于小样本学习的特征对齐技术

2024-08 · 6 分钟 · 2663 字

超越存储：解析叠加态计算背后的数学原理

2024-08 · 7 分钟 · 3291 字

七月 ¹²

学会学习：深入探索元学习与表示学习的理论基础

2024-07 · 7 分钟 · 3010 字

训练不可训练的模型：JumpReLU 如何在语言模型中解锁更优特征

2024-07 · 7 分钟 · 3047 字

破解黑箱：Transformer 可解释性机理实用指南

2024-07 · 11 分钟 · 5227 字

永不遗忘：MAGMAX 和模型合并如何革新持续学习

2024-07 · 7 分钟 · 3180 字

C-ADA：一种更快、更智能且不会遗忘的人工智能学习方式

2024-07 · 7 分钟 · 3104 字

超越钻石：ODYSSEY 如何训练 AI 掌握《我的世界》开放世界

2024-07 · 8 分钟 · 3650 字

RNN 回归？让隐藏状态成为学习器，解锁长上下文潜力

2024-07 · 7 分钟 · 3348 字

自我意识悖论：教神经网络自我建模如何使其变得更简单

2024-07 · 7 分钟 · 3050 字

Train-Attention：教会大语言模型在持续学习中关注关键信息

2024-07 · 3 分钟 · 1233 字

Longhorn：将状态空间模型重新构想为在线学习器

2024-07 · 7 分钟 · 3200 字

从 30 分钟到 3 分钟：MInference 如何将百万词元提示的 LLM 等待时间缩短

2024-07 · 5 分钟 · 2328 字

深入解析 FlashAttention-3：异步与 FP8 如何为 Transformer 加速

2024-07 · 6 分钟 · 2698 字

六月 ¹³

MEMENTO: Teaching Neural Solvers to Remember — Faster, Smarter Routing with Memory-Augmented Inference

2024-06 · 15 分钟 · 7267 字

协作式“学习如何学习”——陪练伙伴如何提升元学习效果

2024-06 · 7 分钟 · 3232 字

为神经过程注入强劲动力：上下文内上下文学习如何利用相似数据集

2024-06 · 7 分钟 · 3457 字

为 Transformer 瘦身：通过边剪枝揭示隐藏电路

2024-06 · 3 分钟 · 1361 字

超越神经元：使用 Transcoder 在大语言模型中寻找可解释回路

2024-06 · 7 分钟 · 3377 字

解构大语言模型：深入探究稀疏自编码器的缩放

2024-06 · 7 分钟 · 3048 字

解码黑箱：为何让大语言模型更具可解释性，也可能让它们更智能

2024-06 · 7 分钟 · 3249 字

为什么你的AI会遗忘——以及专家团队如何解决它：深入探讨用于持续学习的混合专家模型

2024-06 · 7 分钟 · 3424 字

对抗 AI 遗忘症：EVCL 如何结合贝叶斯推断与正则化来掌控持续学习

2024-06 · 6 分钟 · 2978 字

超越排行榜天花板：为什么 MMLU-Pro 是测试 LLM 的新黄金标准

2024-06 · 6 分钟 · 2958 字

超越单打独斗：VillagerAgent 如何教 AI 在《我的世界》中团队合作

2024-06 · 7 分钟 · 3426 字

超越思维链：CPO 如何在不降低速度的情况下让大语言模型更智能

2024-06 · 6 分钟 · 3002 字

超越像素：MASt3R 如何让二维图像匹配扎根于三维现实

2024-06 · 6 分钟 · 2923 字

五月 ¹¹

超越训练数据：深入解析MetaGS，实现逼真的3D重光照

2024-05 · 8 分钟 · 3514 字

解决 AI 的“健忘症”：深入解析 MGSER-SAM，实现更智能的持续学习

2024-05 · 6 分钟 · 2919 字

CAMeLU：利用上下文学习教 Transformer 从无标签数据中学习

2024-05 · 8 分钟 · 3845 字

驯服混乱：分组多样化 AI 模型如何增强无数据元学习

2024-05 · 6 分钟 · 2920 字

结合贝叶斯与元学习，摆脱灾难性遗忘

2024-05 · 7 分钟 · 3394 字

教 LLM 学习：MAML-en-LLM 如何解锁更强的情境学习能力

2024-05 · 6 分钟 · 2990 字

深入解析YOLOv10：它如何实现端到端的速度与SOTA精度

2024-05 · 7 分钟 · 3078 字

初识 MicroAdam：可证明收敛的内存节省型优化器

2024-05 · 6 分钟 · 2734 字

RNN 的回归？深入解读 xLSTM

2024-05 · 10 分钟 · 4633 字

Mamba‑2 解析：连接状态空间模型与注意力机制的对偶性

2024-05 · 10 分钟 · 4964 字

2024-05 · 6 分钟 · 2964 字

四月 ⁷

永不停学：CLP 算法如何让机器人在真实世界中自适应

2024-04 · 7 分钟 · 3132 字

教大语言模型即学即会：深入解析用于关系抽取的 MICRE

2024-04 · 7 分钟 · 3330 字

解决 AI 的“失忆症”：深入解析基于效用的扰动梯度下降 (UPGD)

2024-04 · 7 分钟 · 3164 字

归纳、演绎、溯因：解构大语言模型的三大推理谜题

2024-04 · 6 分钟 · 2831 字

学习泛化：元学习如何破解域泛化难题

2024-04 · 8 分钟 · 3748 字

一次训练，永续推断：深入探讨摊销神经推断

2024-04 · 10 分钟 · 4968 字

从 2D 像素到 3D 溅射：GS-LRM 如何仅凭几张图像重建世界

2024-04 · 5 分钟 · 2408 字

三月 ⁸

永不止步的 Transformer：深入探讨在线持续学习

2024-03 · 7 分钟 · 3142 字

超越神经元：寻找并修复大语言模型内部的可解释回路

2024-03 · 7 分钟 · 3504 字

一个框架统领全局：统一持续学习并引入‘刷新学习’

2024-03 · 7 分钟 · 3159 字

MATHVERSE：AI 模型真的能看懂数学问题中的图表吗？

2024-03 · 8 分钟 · 3693 字

超越碰撞检测：教会 AI 理解事故发生的原因

2024-03 · 7 分钟 · 3169 字

MVSplat：仅用几张照片，构建令人惊叹的 3D 世界

2024-03 · 5 分钟 · 2446 字

超越 Transformer：VideoMamba 如何解锁高效的长视频理解

2024-03 · 6 分钟 · 2572 字

超越 Transformer：LocalMamba 如何释放状态空间模型在视觉领域的潜力

2024-03 · 5 分钟 · 2445 字

二月 ¹²

将物资送给最需要的人：效用最大化的新视角

2024-02 · 8 分钟 · 3775 字

对抗 AI“失忆症”：深入解析 CORE 的认知回放

2024-02 · 6 分钟 · 2972 字

永不止步：我们如何让大型语言模型保持最新

2024-02 · 7 分钟 · 3371 字

GPT-4 能在《我的世界》中搞建筑吗？大型语言模型作为协作式游戏智能体

2024-02 · 6 分钟 · 2692 字

BitNet b1.58：可能永远改变 AI 的 1 比特大语言模型

2024-02 · 6 分钟 · 2966 字

超越梯度下降：Transformer 如何发现自己的优化算法

2024-02 · 6 分钟 · 2710 字

从零星数据中学习——深入探讨图上少样本学习

2024-02 · 7 分钟 · 3283 字

LLM 如何实现“现学现卖”？深入解析上下文学习

2024-02 · 7 分钟 · 3037 字

耐心的力量：分块更新如何解决延迟老虎机反馈问题

2024-02 · 6 分钟 · 2981 字

超越文本：GITA 如何教 AI 看懂图并进行推理

2024-02 · 6 分钟 · 2736 字

超越晴天：G-NAS 如何让目标检测器在黑暗中也能看清

2024-02 · 5 分钟 · 2462 字

LGM：使用高斯泼溅技术在 5 秒内创建高分辨率 3D 模型

2024-02 · 5 分钟 · 2480 字

一月 ⁴

永不遗忘的 AI 新纪元：预训练模型持续学习指南

2024-01 · 8 分钟 · 3527 字

将3D高斯溅射场景压缩31倍，渲染速度提升4倍

2024-01 · 6 分钟 · 2632 字

Vision Mamba：Transformer 在计算机视觉领域的新挑战者？

2024-01 · 6 分钟 · 2581 字

VMamba：计算机视觉领域 CNN 与 Transformer 的新挑战者

2024-01 · 5 分钟 · 2402 字

2023 ⁷⁸

十二月 ⁶

教神经网络记忆：一种能学习自身学习算法的人工智能

2023-12 · 8 分钟 · 3551 字

从涌现中学习：抑制“记忆型”神经元如何提升 AI 性能

2023-12 · 7 分钟 · 3399 字

AI 如何利用知识图谱学会做出有根据的猜测

2023-12 · 7 分钟 · 3008 字

MP5：如何构建一个会思考、感知和规划的《我的世界》AI

2023-12 · 7 分钟 · 3247 字

超越真实感：Feature 3DGS 为 3D 场景带来 AI 理解能力

2023-12 · 6 分钟 · 2561 字

DUSt3R 如何重新定义三维重建——无需相机信息

2023-12 · 6 分钟 · 2768 字

十一月 ¹⁰

Meta-Adapter：一种“学会学习”的方法，仅用少量样本即可增强 CLIP

2023-11 · 7 分钟 · 3141 字

对抗 AI 的“胡言乱语”：介绍用于评估视觉幻觉的新基准 AMBER

2023-11 · 6 分钟 · 2878 字

超越浅层对齐：CogVLM 如何让语言模型学会“看见”

2023-11 · 7 分钟 · 3183 字

破解黑盒：深入探究大语言模型如何即时学习

2023-11 · 7 分钟 · 3382 字

解开纠缠之网：元学习、在线学习与持续学习指南

2023-11 · 9 分钟 · 4072 字

提炼公平性：公平 Wasserstein 核集如何应对大数据中的偏见问题

2023-11 · 8 分钟 · 3698 字

LightGaussian：将 3D 场景压缩 15 倍，同时提升渲染速度

2023-11 · 5 分钟 · 2264 字

GaussianShader：为实时渲染带来逼真的反射效果

2023-11 · 6 分钟 · 2649 字

GS-SLAM：高斯溅射开启实时3D建图新纪元

2023-11 · 5 分钟 · 2281 字

Mip-Splatting：三维高斯溅射中实现清晰变焦的秘密

2023-11 · 4 分钟 · 1895 字

十月 ⁶

LSTM 能学会如何学习吗？深入探讨外积 LSTM

2023-10 · 7 分钟 · 3432 字

BitNet：1-bit Transformer 开启大语言模型新纪元

2023-10 · 6 分钟 · 2871 字

ClusT3：利用信息不变聚类适应未知环境

2023-10 · 7 分钟 · 3326 字

超越 Transformer：用 Monarch Mixer 实现深度学习的亚二次方扩展

2023-10 · 8 分钟 · 3941 字

GaussianDreamer：融合2D与3D AI，15分钟从文本生成惊艳3D模型

2023-10 · 6 分钟 · 2716 字

解锁海量上下文：深入解读 DISTFLASHATTN

2023-10 · 5 分钟 · 2385 字

九月 ⁴

超越神经元：用稀疏自动编码器发现语言模型中的真正特征

2023-09 · 7 分钟 · 3083 字

超越实验室：一百万次真实世界对话揭示了 LLM 的什么？

2023-09 · 7 分钟 · 3177 字

AI 能取代人类训练大语言模型吗？深入探讨 RLAIF

2023-09 · 7 分钟 · 3038 字

Promptbreeder：大型语言模型如何自我教学，成为更优秀的问题解决者

2023-09 · 7 分钟 · 3306 字

八月 ²

用自然语言解锁数据库：深入探索 DAIL-SQL 与提示工程

2023-08 · 7 分钟 · 3234 字

实时辐射场：深入解析3D高斯溅射技术

2023-08 · 6 分钟 · 2593 字

七月 ⁵

学会学习：深入探索元学习的世界

2023-07 · 8 分钟 · 3576 字

MetaDiff：我们能像训练扩散模型一样训练少样本学习器吗？

2023-07 · 6 分钟 · 3004 字

永不遗忘：随机投影如何帮助 AI 持续学习

2023-07 · 8 分钟 · 3516 字

RLHF 的问题：深入剖析用人类反馈训练 AI 的缺陷

2023-07 · 7 分钟 · 3136 字

FlashAttention-2：为 Transformer 带来更迅捷、更高效的注意力机制

2023-07 · 7 分钟 · 3084 字

六月 ¹¹

Wanda：一种同时关注权重和激活值的 LLM 剪枝方法

2023-06 · 7 分钟 · 3380 字

超网络：构建其他神经网络的神经网络

2023-06 · 7 分钟 · 3315 字

深度学习的阿喀琉斯之踵：为什么神经网络会忘记如何学习

2023-06 · 7 分钟 · 3426 字

PandaLM 简介：让其他 AI 模型更聪明的 AI 裁判

2023-06 · 6 分钟 · 2869 字

LLM-Blender：融合语言模型精粹，打造更智能的AI

2023-06 · 6 分钟 · 2791 字

视觉语言模型究竟有多强？深入解析 MME 基准测试

2023-06 · 5 分钟 · 2373 字

AI 能评判 AI 吗？深入探讨使用 LLM 进行聊天机器人评估

2023-06 · 7 分钟 · 3374 字

认识 STEVE-1：研究人员如何仅用 60 美元就教会一个 Minecraft 智能体听懂指令

2023-06 · 8 分钟 · 3669 字

我们如何从少量信息中学到如此之多：一个用自然语言思考的贝叶斯模型

2023-06 · 6 分钟 · 2966 字

用…SGD求解巨型高斯过程？深入探究良性非收敛现象

2023-06 · 6 分钟 · 2656 字

超越 FlashAttention：利用动态稀疏性让 Transformer 再提速

2023-06 · 5 分钟 · 2270 字

五月 ¹¹

注意力机制的内存“零”开销：深入解析恒定内存注意力神经过程

2023-05 · 8 分钟 · 3570 字

超越少样本学习：LLM 如何教会自己更好地学习

2023-05 · 7 分钟 · 3039 字

追求完美记忆：深入剖析理想的持续学习者

2023-05 · 7 分钟 · 3233 字

强经验回放：对抗灾难性遗忘的新利器

2023-05 · 7 分钟 · 3124 字

更深不一定更好：理解现代神经网络中的“隧道效应”

2023-05 · 6 分钟 · 3004 字

BIRD 已经降临：一个新的基准测试，用于检验 LLM 是否真的能与大数据对话

2023-05 · 7 分钟 · 3309 字

GITM：一个由 LLM 驱动的“幽灵”如何掌控《我的世界》的科技树

2023-05 · 7 分钟 · 3334 字

超越监督学习：用强化学习微调扩散模型

2023-05 · 7 分钟 · 3262 字

深度集成为何有效？新理论将其与贝叶斯方法统一

2023-05 · 6 分钟 · 2689 字

解锁黑箱：大语言模型中思维链背后的理论

2023-05 · 9 分钟 · 4409 字

超越微调：深入探究任务算术与权重解耦

2023-05 · 6 分钟 · 2523 字

四月 ⁵

分割任意对象：为图像分割构建基础模型

2023-04 · 13 分钟 · 6378 字

思维链为何有效：关键在于局部经验

2023-04 · 7 分钟 · 3084 字

逆向工程 AI：深入探索自动化电路发现

2023-04 · 7 分钟 · 3226 字

为什么随机切分是解释聚类的最佳方法

2023-04 · 6 分钟 · 2531 字

从v1到v8及更远：YOLO的完整发展史

2023-04 · 8 分钟 · 3529 字

三月 ⁷

AGI 的火花：深入探讨 GPT-4 惊人的能力

2023-03 · 9 分钟 · 4214 字

学会学习：元学习如何攻克金融AI中的数据稀缺难题

2023-03 · 6 分钟 · 2837 字

学会学习：元学习在小样本场景下的深度指南

2023-03 · 10 分钟 · 4769 字

Reflexion：语言模型如何通过与自己对话来从错误中学习

2023-03 · 7 分钟 · 3254 字

当你的模型遇到真实世界——深入解析测试时自适应

2023-03 · 10 分钟 · 4996 字

超越试错：LLM 智能体如何通过自言自语进行学习

2023-03 · 6 分钟 · 2771 字

Zero-1-to-3：AI如何从单张照片想象出3D物体

2023-03 · 6 分钟 · 2750 字

二月 ⁸

Mnemosyne：学习优化其他神经网络的 Transformer

2023-02 · 7 分钟 · 3091 字

永不止步：AI持续学习深度指南

2023-02 · 12 分钟 · 5744 字

ESMER：一种受大脑启发的解决方案，用于修复神经网络中的灾难性遗忘

2023-02 · 6 分钟 · 2955 字

终身学习背后的数学：深入探究遗忘与泛化

2023-02 · 7 分钟 · 3319 字

Transformer 没了安全网还能走多深？驯服原生模型中的信号传播

2023-02 · 7 分钟 · 3225 字

告别从零开始：用先验数据为强化学习增效的简单秘诀

2023-02 · 7 分钟 · 3285 字

EvoPrompting：如何将语言模型进化为 AI 架构大师

2023-02 · 6 分钟 · 2634 字

TPVFormer：用三视角视图从二维快照重建三维世界

2023-02 · 6 分钟 · 2674 字

一月 ³

BLIP-2：如何高效地教会大型语言模型“看见”

2023-01 · 7 分钟 · 3266 字

SparseGPT：如何在无需再训练的情况下从 LLM 中删除 1000 亿参数

2023-01 · 7 分钟 · 3184 字

学习如何学习：深入探索元强化学习

2023-01 · 10 分钟 · 4648 字

2022 ²⁵

十二月 ³

Whisper：深入探究 OpenAI 对人类级语音识别的追求

2022-12 · 8 分钟 · 3549 字

超越记忆：Transformer 如何元学习通用学习算法

2022-12 · 7 分钟 · 3114 字

Pile 数据集上的饿饿河马：Transformer 王座的新挑战者

2022-12 · 6 分钟 · 2878 字

十一月 ²

从薛定谔桥到神经网络：一种新的端到端熵正则化最优传输求解器

2022-11 · 5 分钟 · 2500 字

重新思考神经网络设计：深度剖析梯度路径分析

2022-11 · 6 分钟 · 2603 字

十月 ¹

NeRF、高斯泼溅及未来：神经辐射场导览

2022-10 · 8 分钟 · 4007 字

九月 ⁴

多模态AI巡礼：塑造未来的六大核心挑战

2022-09 · 12 分钟 · 5649 字

超越重用：教会元学习模型习得新特征

2022-09 · 7 分钟 · 3113 字

当神经元变得拥挤：深入探究叠加现象

2022-09 · 11 分钟 · 5340 字

扩散模型的全景之旅：从基础到前沿

2022-09 · 11 分钟 · 5278 字

八月 ¹

超越缺口：深入解析 SSSD 在时间序列插补与预测中的应用

2022-08 · 5 分钟 · 2470 字

七月 ¹

AdaptCL：在不断变化的数据上训练单一 AI 模型且不会遗忘

2022-07 · 7 分钟 · 3380 字

六月 ³

寻找更平坦的谷底：Sharp-MAML 如何改进小样本学习

2022-06 · 7 分钟 · 3477 字

为学习而生：打造能够自我适应与演化的人工智能

2022-06 · 7 分钟 · 3269 字

更简单的 S4：对角状态空间模型（S4D）如何以更低复杂度实现同等性能

2022-06 · 6 分钟 · 2778 字

五月 ¹

FlashAttention：IO 感知是解锁长上下文 Transformer 的关键吗？

2022-05 · 6 分钟 · 2600 字

三月 ⁴

InstructGPT：通过人类反馈教 GPT-3 遵循指令

2022-03 · 9 分钟 · 4119 字

解码 MAML：一种用于超快速神经架构搜索的新核函数

2022-03 · 6 分钟 · 2900 字

超越大数据：深入探索小样本学习

2022-03 · 8 分钟 · 3735 字

为什么AI会遗忘，而我们（通常）不会：来自大脑中“持续学习者”的启示

2022-03 · 7 分钟 · 3490 字

二月 ²

学习如何学习：自修改网络如何解锁真正的人工智能适应性

2022-02 · 8 分钟 · 3642 字

SASHIMI：用状态空间模型切分原始音频

2022-02 · 2 分钟 · 780 字

一月 ³

大道至简：EASY 如何用简单技巧实现顶尖小样本学习

2022-01 · 7 分钟 · 3373 字

重写过去，预备未来：深入解析持续学习模型 X-DER

2022-01 · 8 分钟 · 3776 字

让每个像素都物尽其用：深入解析高效非局部对比注意力

2022-01 · 5 分钟 · 2473 字

2021 ²⁷

十二月 ²

向大师学习：深入解析 Ex-Model 持续学习

2021-12 · 7 分钟 · 3280 字

潜在扩散模型如何生成令人惊叹的 AI 艺术（Stable Diffusion 论文详解）

2021-12 · 8 分钟 · 3515 字

十一月 ¹

教机器描述视频：深入解析 SWINBERT

2021-11 · 5 分钟 · 2437 字

十月 ⁴

SpeechT5：一个模型统领所有语音与文本任务

2021-10 · 4 分钟 · 1685 字

教语言模型即时学习：深入解析上下文调优 (ICT)

2021-10 · 6 分钟 · 2929 字

超越提示工程：MetaICL 如何教会语言模型即时学习

2021-10 · 6 分钟 · 2836 字

序列模型的瑞士军刀：深入探究线性状态空间层

2021-10 · 6 分钟 · 2727 字

九月 ¹

只需告诉模型做什么：指令精调如何解锁零样本学习能力

2021-09 · 9 分钟 · 4045 字

八月 ¹

当程序库没有规则：一个数据驱动的侦探故事，揭秘代码规约

2021-08 · 7 分钟 · 3257 字

七月 ¹

深入 Codex：驱动 GitHub Copilot 的 AI 结对程序员

2021-07 · 6 分钟 · 2529 字

六月 ⁵

超越 Adam：AI 如何学会优化神经网络

2021-06 · 7 分钟 · 3492 字

元学习的进化提速：深入解析 EvoGrad

2021-06 · 7 分钟 · 3279 字

一个模型统治所有？为何持续学习需要一个“模型动物园”

2021-06 · 7 分钟 · 3224 字

Decision Transformer：当语言模型学会玩游戏

2021-06 · 6 分钟 · 2799 字

LoRA：用万分之一的参数，微调超大语言模型

2021-06 · 5 分钟 · 2406 字

五月 ¹

为什么视觉变换器出人意料地稳健：来自《视觉变换器是稳健的学习者》的洞见

2021-05 · 12 分钟 · 5725 字

四月 ³

AST：视觉 Transformer 是如何学会聆听的

2021-04 · 7 分钟 · 3212 字

用手术刀探测：发现语言模型已知的内容

2021-04 · 7 分钟 · 3105 字

GANcraft：用 AI 将我的世界（Minecraft）世界变为照片般逼真的现实

2021-04 · 7 分钟 · 3391 字

三月 ⁴

CLIP 解析：用语言教视觉模型（以及为什么有效）

2021-03 · 15 分钟 · 7209 字

超越 MAML：自适应学习与任务优先化如何增强元学习

2021-03 · 6 分钟 · 2689 字

不止是回放，更要学会如何回放：用 MetaSGD 为持续学习增压

2021-03 · 6 分钟 · 2790 字

终身学习：梯度投影记忆如何战胜灾难性遗忘

2021-03 · 7 分钟 · 3289 字

二月 ²

超越小样本：让元学习适用于大规模任务

2021-02 · 7 分钟 · 3424 字

数小时而非数天找到顶尖神经网络：深入解读免训练 NAS

2021-02 · 6 分钟 · 2809 字

一月 ²

从像素到令牌：T2T‑ViT 如何让 Transformer 在 ImageNet 上发挥作用

2021-01 · 10 分钟 · 4526 字

Switch Transformer：一个出乎意料高效的万亿参数 AI 模型

2021-01 · 7 分钟 · 3294 字

2020 ³⁷

十二月 ²

从 O(n²) 到 O(n)：深入探究极速 WordPiece 分词算法

2020-12 · 6 分钟 · 2547 字

SpAtten：通过剪枝冗余语言，让 Transformer 更加“斯巴达”

2020-12 · 6 分钟 · 2859 字

十一月 ³

借助文本信息，提升小样本学习能力

2020-11 · 7 分钟 · 3115 字

学会学习：人工智能能教给我们关于大脑的什么（以及反之亦然）

2020-11 · 7 分钟 · 3238 字

超越偏差与方差：精细审视双下降现象

2020-11 · 10 分钟 · 4572 字

十月 ⁴

如何教会 AI 新技能，又不忘旧本领

2020-10 · 7 分钟 · 3089 字

超越良好起点：PAMELA 如何学习快速适应的路径

2020-10 · 7 分钟 · 3247 字

Vision Transformer (ViT)：教 Transformer 学会看图

2020-10 · 7 分钟 · 3152 字

LEAStereo – AI 如何学会设计顶尖的 3D 视觉模型

2020-10 · 7 分钟 · 3342 字

八月 ¹

超越双重下降：泛化的多尺度理论

2020-08 · 7 分钟 · 3225 字

七月 ¹

永不遗忘：La-MAML 如何教模型进行持续学习

2020-07 · 7 分钟 · 3092 字

六月 ⁵

神经网络剪枝的隐藏规则：深入探究缩放定律

2020-06 · 7 分钟 · 3267 字

让 Transformer 飞起来 —— 深入探究线性注意力

2020-06 · 7 分钟 · 3065 字

数秒内找到顶级神经网络——无需任何训练

2020-06 · 6 分钟 · 2632 字

从噪声到高保真图像——深入解读去噪扩散模型

2020-06 · 5 分钟 · 2372 字

从过去中学习：保守 Q 学习如何解锁离线强化学习

2020-06 · 6 分钟 · 2710 字

五月 ⁴

RAG：如何让你的大语言模型进行一场开卷考试

2020-05 · 7 分钟 · 3329 字

超越成对比较：用上下文提升小样本学习

2020-05 · 7 分钟 · 3169 字

超越最后一层：赋予解码器立体视觉，实现更智能的文本生成

2020-05 · 7 分钟 · 3116 字

超越最后一层：用多视角解码为 Transformer 注入强劲动力

2020-05 · 7 分钟 · 3240 字

四月 ⁵

机器如何学会学习：元学习深度指南

2020-04 · 10 分钟 · 4968 字

学会学习：深入探索元学习的全景

2020-04 · 7 分钟 · 3079 字

从像素学习的速度大幅提升：深入解析 CURL

2020-04 · 5 分钟 · 2327 字

超越在线训练：介绍用于真实世界离线强化学习的 D4RL

2020-04 · 6 分钟 · 2973 字

YOLOv4: 打破速度与精度的平衡难题，单GPU即可训练的最强检测器

2020-04 · 5 分钟 · 2149 字

三月 ⁴

聪明剪枝，而非蛮力：深入解析学习阈值剪枝

2020-03 · 6 分钟 · 2936 字

剪枝悖论：为何我们无法判断哪种神经网络剪枝方法是最好的

2020-03 · 8 分钟 · 3831 字

驯服二次方猛兽——路由 Transformer 如何扩展至超长序列

2020-03 · 6 分钟 · 2827 字

BigNAS：一次训练，随处部署的单阶段神经架构搜索

2020-03 · 6 分钟 · 2935 字

二月 ⁵

超越黑箱：元学习为何如此擅长小样本学习？

2020-02 · 7 分钟 · 3009 字

MAML 为何有效？深入探究元学习理论

2020-02 · 7 分钟 · 3015 字

方差的惊人形状：重新思考深度学习中的偏差-方差权衡

2020-02 · 7 分钟 · 3124 字

训练更少，收获更多：对抗训练中过拟合的惊人真相

2020-02 · 7 分钟 · 3357 字

Backpropamine：教神经网络自我重构

2020-02 · 7 分钟 · 3156 字

一月 ³

破解一次性 NAS 的密码：深入解析 NAS-Bench-1Shot1 基准

2020-01 · 6 分钟 · 2921 字

神经网络的公平竞技场：深入解析 NAS-Bench-201

2020-01 · 6 分钟 · 2777 字

量变引起质变 —— 语言模型性能惊人的可预测性

2020-01 · 6 分钟 · 2980 字

2019 ¹⁵

十一月 ¹

能教会老模型新把戏吗？深入探究迁移学习

2019-11 · 9 分钟 · 4269 字

十月 ⁴

超越“一刀切”的元学习：深入解读 MMAML

2019-10 · 7 分钟 · 3418 字

压缩、挑选、增长：一种更智能的 AI 无遗忘学习方式

2019-10 · 6 分钟 · 2892 字

超越 8 位：BitNet 如何让你的数字世界更平滑

2019-10 · 6 分钟 · 2883 字

从 ZeRO 到万亿：深入探究巨型 AI 模型背后的内存优化技术

2019-10 · 6 分钟 · 2979 字

九月 ⁴

超越简单比较：PARN 如何教会网络“看见”物体的位置

2019-09 · 7 分钟 · 3295 字

稳定性–可塑性困境：持续学习研究导览

2019-09 · 10 分钟 · 5003 字

不要只测试——也要训练！利用自监督实时适应新数据

2019-09 · 7 分钟 · 3097 字

Megatron-LM：借助优雅的 PyTorch 并行化，将语言模型扩展至数十亿参数

2019-09 · 5 分钟 · 2486 字

六月 ¹

自适应地学习如何学习：深入解读 ARUBA 框架

2019-06 · 6 分钟 · 2951 字

五月 ³

学会适应：深入解析 TapNet 在小样本分类中的投影力量

2019-05 · 7 分钟 · 3088 字

Alpha MAML：解除元学习中的超参数困扰

2019-05 · 6 分钟 · 2818 字

即时生成神经网络：深入解析 LGM-Net

2019-05 · 7 分钟 · 3492 字

三月 ²

对齐，而非简单匹配：深入解读可解释的单样本学习

2019-03 · 7 分钟 · 3098 字

解读双下降：为什么更多参数能带来更好的模型

2019-03 · 4 分钟 · 1939 字

2018 ²³

十二月 ⁴

超越微调：元迁移学习如何掌握小样本识别

2018-12 · 7 分钟 · 3082 字

超越单一起点：面向多样化和不相交任务的元学习

2018-12 · 6 分钟 · 2878 字

终身学习，既不遗忘（也不破产）：深入解析 A-GEM

2018-12 · 7 分钟 · 3353 字

ProxylessNAS：直接在你的目标硬件上搜索最优神经网络

2018-12 · 6 分钟 · 2737 字

十一月 ¹

别忘了！经验回放如何解决人工智能的“失忆”问题

2018-11 · 7 分钟 · 3130 字

十月 ¹

深入解析 BERT：双向 Transformer 如何重新定义 NLP

2018-10 · 7 分钟 · 3355 字

七月 ¹

在潜在仙境中学习如何学习：深入解析 LEO

2018-07 · 8 分钟 · 3609 字

六月 ²

PLATIPUS——当一个模型无法满足小样本学习

2018-06 · 7 分钟 · 3311 字

教神经网络如何记忆：深入探索元持续学习

2018-06 · 6 分钟 · 2951 字

五月 ¹

超越翻转与裁剪：AutoAugment 如何教 AI 增强自身数据

2018-05 · 7 分钟 · 3011 字

四月 ³

如何教会神经网络从单个样本中学习

2018-04 · 7 分钟 · 3060 字

一个句子，多种分词：子词正则化在神经机器翻译中的威力

2018-04 · 7 分钟 · 3091 字

YOLOv3：渐进式改进如何打造实时检测利器

2018-04 · 5 分钟 · 2178 字

三月 ³

超越标注数据：无标签样本如何助力小样本学习

2018-03 · 7 分钟 · 3258 字

Reptile：一个简单而强大的元学习技巧

2018-03 · 8 分钟 · 3549 字

你的神经网络中彩票了吗？解析“彩票假说”

2018-03 · 7 分钟 · 3402 字

二月 ⁵

超越固定距离：条件嵌入如何重新定义小样本学习

2018-02 · 6 分钟 · 2938 字

超越原始像素：深度元学习如何教AI学习概念

2018-02 · 6 分钟 · 2966 字

解锁 AI 的终身学习：受大脑启发的门控机制如何防止灾难性遗忘

2018-02 · 7 分钟 · 3246 字

ELMo：语境与深度表示如何永久改变了 NLP

2018-02 · 6 分钟 · 2847 字

ENAS：让神经架构搜索快 1000 倍

2018-02 · 6 分钟 · 2995 字

一月 ²

向终身学习致敬：硬注意力（HAT）如何防止神经网络失忆

2018-01 · 5 分钟 · 2123 字

Piggyback：让老网络掌握新技巧而不遗忘

2018-01 · 7 分钟 · 3293 字

2017 ²⁰

十二月 ¹

PNAS：如何在不耗尽资源的情况下找到顶级性能的神经网络

2017-12 · 5 分钟 · 2504 字

十一月 ⁵

从少量样本中学习：深入解析用于小样本学习的图神经网络

2017-11 · 7 分钟 · 3280 字

以少胜多：利用无标签数据和智能查询增强原型网络

2017-11 · 6 分钟 · 2770 字

关系网络如何通过学习比较掌握小样本学习

2017-11 · 7 分钟 · 3159 字

用可扩展的回忆解决人工智能的“失忆症”

2017-11 · 8 分钟 · 3513 字

对抗 AI 遗忘症：PackNet 如何在不忘记旧知识的情况下教会网络新技巧

2017-11 · 7 分钟 · 3430 字

十月 ¹

超越 ReLU：自动化搜索如何发现 Swish 激活函数

2017-10 · 6 分钟 · 2522 字

八月 ¹

NLP 的“ImageNet 时刻”？机器翻译如何为我们带来情境化词向量

2017-08 · 7 分钟 · 3103 字

七月 ²

快速学会学习：深入解析 Meta-SGD

2017-07 · 6 分钟 · 2883 字

PPO详解：易于实现、难以超越的强化学习算法

2017-07 · 6 分钟 · 2734 字

六月 ²

永不忘记任务：深入解析梯度情节记忆 (GEM)

2017-06 · 7 分钟 · 3336 字

剖析 Transformer：这篇论文彻底改变了 NLP

2017-06 · 7 分钟 · 3110 字

五月 ²

更快、更强、卷积：一种新的机器翻译架构

2017-05 · 8 分钟 · 3656 字

从像素到毕加索：深入探索神经风格迁移

2017-05 · 5 分钟 · 2298 字

三月 ⁶

超越 Adam：我们能为神经网络学习一个更好的优化器吗？

2017-03 · 7 分钟 · 3502 字

教 AI 学会优化：学习型优化器如何实现扩展与泛化

2017-03 · 7 分钟 · 3366 字

用原型学习“如何学习”：深入解析原型网络

2017-03 · 7 分钟 · 3045 字

MAML：如何学会学习（无需天才）

2017-03 · 7 分钟 · 3282 字

神经网络能终身学习吗？深入解析突触智能

2017-03 · 7 分钟 · 3496 字

超越边界框：深入解析 Mask R-CNN

2017-03 · 7 分钟 · 3022 字

2016 ¹³

十二月 ²

解决 AI 的“失忆症”：深入解析弹性权重巩固

2016-12 · 7 分钟 · 3419 字

YOLO9000: 一个能识别9000种物体的实时检测器

2016-12 · 6 分钟 · 2736 字

十一月 ³

永不遗忘：iCaRL 如何让深度学习模型持续学习

2016-11 · 7 分钟 · 3028 字

如何训练一个 AI 来设计其他 AI：深入解析神经架构搜索

2016-11 · 6 分钟 · 2757 字

ResNeXt：为深度神经网络设计增加一个新维度

2016-11 · 6 分钟 · 2612 字

九月 ¹

超网络——当一个神经网络学会构建另一个网络

2016-09 · 7 分钟 · 3164 字

七月 ¹

FastText 详解：字符 N‑gram 如何彻底改变词嵌入

2016-07 · 7 分钟 · 3253 字

六月 ⁵

一击定乾坤——匹配网络如何从单个样本中学习

2016-06 · 7 分钟 · 3303 字

统领全场的 AI：训练神经网络成为优化器

2016-06 · 7 分钟 · 3129 字

基于经验构建：渐进式网络如何在不遗忘的情况下进行序列学习

2016-06 · 3 分钟 · 1168 字

如何教 AI 新技能，同时不让它忘记旧本领

2016-06 · 6 分钟 · 2732 字

超越切片：V-Net 如何彻底改变 3D 医学图像分割

2016-06 · 5 分钟 · 2444 字

二月 ¹

忘掉经验回放：深度强化学习中的 A3C 革命

2016-02 · 7 分钟 · 3114 字

2015 ¹³

十二月 ²

为什么你的 RNN 会过拟合——以及如何用贝叶斯 Dropout 解决它

2015-12 · 7 分钟 · 3015 字

更智能，而非更堆砌：谷歌 Inception V2 和 V3 如何重新思考深度学习架构

2015-12 · 6 分钟 · 2579 字

十一月 ¹

DCGAN 详解：利用生成式 AI 解锁无监督学习的力量

2015-11 · 5 分钟 · 2385 字

十月 ¹

CNN文本分类超参数终极指南

2015-10 · 7 分钟 · 3392 字

八月 ²

超越单词：亚词单元如何解决机器翻译的核心难题

2015-08 · 7 分钟 · 3072 字

内容与风格：教会计算机像梵高一样绘画的算法

2015-08 · 6 分钟 · 2687 字

六月 ⁴

打开黑箱：LSTM 如何学习长程依赖

2015-06 · 6 分钟 · 2550 字

Faster R-CNN: 让实时目标检测成为可能的突破性技术

2015-06 · 5 分钟 · 2179 字

YOLO：让计算机视觉实现实时检测的革命性突破

2015-06 · 6 分钟 · 2549 字

YOLO: 一眼识别世界的实时目标检测革命

2015-06 · 6 分钟 · 2525 字

五月 ¹

U-Net: 用小数据实现精准分割的深度学习架构

2015-05 · 5 分钟 · 2415 字

三月 ¹

终极LSTM对决：深入探索《搜索空间奥德赛》

2015-03 · 6 分钟 · 2917 字

二月 ¹

重新思考深度 RNN：门控反馈连接的力量

2015-02 · 5 分钟 · 2326 字

2014 ¹¹

十二月 ²

LSTM vs. GRU：门控循环神经网络的对决

2014-12 · 6 分钟 · 2695 字

Adam优化器深度解析：现代深度学习的秘密武器

2014-12 · 5 分钟 · 2132 字

十一月 ²

通用 vs. 专用：深入探究神经网络特征的可迁移性

2014-11 · 6 分钟 · 2771 字

FCN: 让 CNN 实现像素级语义分割的开创性工作

2014-11 · 5 分钟 · 2417 字

十月 ¹

教神经网络像计算机一样思考：神经图灵机

2014-10 · 5 分钟 · 2186 字

九月 ³

突破瓶颈：注意力机制如何彻底改变神经机器翻译

2014-09 · 7 分钟 · 3488 字

开启现代自然语言处理革命的论文：理解基于 LSTM 的 Seq2Seq 模型

2014-09 · 6 分钟 · 2678 字

让 Dropout 在 RNN 上奏效的简单技巧

2014-09 · 6 分钟 · 2786 字

六月 ³

GANs详解：深入解读开创时代的奠基之作

2014-06 · 7 分钟 · 3192 字

教机器看哪里：深入解析循环视觉注意力模型

2014-06 · 7 分钟 · 3391 字

打破固定尺寸限制:SPP-net 如何让 CNN 快 100 倍

2014-06 · 5 分钟 · 2470 字

2013 ⁵

十二月 ²

深度Q网络：人工智能如何从像素称霸雅达利游戏

2013-12 · 7 分钟 · 3326 字

解锁生成模型：深入解析变分自编码器

2013-12 · 8 分钟 · 3560 字

十一月 ²

R-CNN: 深度学习如何彻底革新目标检测

2013-11 · 6 分钟 · 2671 字

打开黑盒：揭秘CNN如何学会"看见"

2013-11 · 6 分钟 · 2531 字

一月 ¹

引爆革命的论文：深入解读Word2Vec

2013-01 · 6 分钟 · 2810 字

2012 ¹

六月 ¹

从像素到概念：表征学习的力量

2012-06 · 11 分钟 · 5086 字

2011 ¹

三月 ¹

重新思考自然语言处理：如何（几乎）从零开始构建一个顶级标注器

2011-03 · 8 分钟 · 3580 字

2025 696

十一月 50

在线梯度变化如何在 Hölder 平滑性下解锁通用加速

EraseFlow：通过引导去噪轨迹擦除不需要的概念

当建议有用时：用不完美预测学习乘积分布

你需要多少自适应性？理解按需采样中的样本—轮次权衡

FlowFeat：教图像记住运动 — 高分辨率、运动感知的像素特征

揭开置信：KLASS 如何加速并稳定掩码扩散采样

从照片到物理：URDF-Anything 如何用 3D MLLM 构建可执行的数字孪生

超越偏好：AI 模型是否理解我们最深层的价值观？

PCA++ — 为什么将特征分散开能使对比式 PCA 对结构化噪声更稳健

CTRL-ALT-DECEIT：AI 智能体会破坏你的代码吗？深度解析

AI能发现新数学吗？教机器理解数学理论中的“有趣”

破解图 Transformer 的密码：统一理论与实践的框架

ATHENA：AI 如何融合符号数学与语言来预测你的个人选择

更聪明，而非更费力：LeMiCa 如何通过全局思维加速 AI 视频生成

更聪明，而非更费力：EPIC 如何教大语言模型选择最佳推理策略

解锁鲁棒的 3D 视觉：深入解析 Cycle-Sync

超越固定步长：前向曲率匹配如何解锁灵活的 3D 重建

快速找到所有优质模型：深入解析 SORTeD

解释之前先校准：深度剖析 ReCalX，构建可信赖的 AI

FAPEX：以分数阶微积分驯服脑电波，实现通用癫痫预测

现实的几何学：通过理解自然图像来检测 AI 生成图像

定位的极限：带噪距离查询能（和不能）揭示什么

虚拟宽度网络：突破二次瓶颈，扩展 Transformer

Depth Anything 3：单个 Transformer 看懂三维世界

为什么去噪模型应该真正去噪：深入解读 JiT

本地 AI 的崛起：用“每瓦智能”衡量并重塑云端

与陪练伙伴一起训练大语言模型：深入解析 RLAC

超越记忆：强化学习如何教会大语言模型导航知识

LLM 的贝叶斯大脑：提示与激活引导如何塑造模型信念

WebVIA：探索、编码并验证交互式网站的 AI 智能体

超越静态数据：LoopTool 的自校正循环如何打造更智能的 LLM 代理

在梦境中训练机器人：WMPO 如何教机器人从想象的失败中学习

思考快，表达准：TiDAR 如何解锁 6 倍 LLM 推理速度

大语言模型的钢丝——开发者如何在 AI 编程助手的机遇与风险间取得平衡

赋予LLM记忆：生成式语义工作空间如何帮助AI理解故事

超越置信度：KLASS 如何利用稳定性解锁更快、更优的扩散模型

从谱到信号原则：一个成本仅 8 千美元的小模型如何学会像 AI 巨头一样推理

我的AI记得什么？揭示AI记忆中隐藏的幻觉

藏于无形：NINJA 攻击如何利用长上下文绕过大语言模型安全机制

超越离散思维：SofT-GRPO 如何让 LLM 在连续空间中推理

超越上下文窗口：IterResearch 如何教 AI 智能体思考、综合并攻克复杂问题

Dr. MAMR：如何让 AI 智能体不再“偷懒”，提升协同推理能力

用人工智能解锁数学发现：深入剖析 AlphaEvolve

超越智能体级搜索：工具到智能体检索如何为 LLM 系统赋能

DreamGym：在合成世界中训练 AI 智能体，以掌控真实世界

超越正确答案：深入解读 IMO-Bench，人工智能数学能力的新黄金标准

Transformer 能中彩票吗？一项新证明在注意力机制中找到了中奖彩票

交叉点：在数据稀缺的世界中，扩散模型如何超越大型语言模型

超越视觉：V-Thinker 如何教 AI 与图像交互以实现更深层次的推理

Sora-2 会思考吗？探索“以视频为思考”的新范式

十月 159

当直线失效：梯度方差如何揭露整流流中的记忆化

TrajMamba 解读：快速、目的感知的车辆轨迹嵌入

Teaching Machines to ‘See’ Space: Grid-Based Spatial Intelligence for Autonomous Driving

像拼乐高一样拼接计划：C‑MCTD 如何让扩散规划器进行全局思考

Diff-ABFlow — 用帧+事件融合与扩散解决模糊与夜间光流

一步到位：岭提升如何同时实现稳健性与半参数效率

教会模型选择性地遗忘：视觉-语言模型的近似领域遗忘

读懂（驾驶者的）思维：使用注意力感知的逆向规划从动作推断注意力偏差

拉伸表示：最小生成树如何帮助自监督学习

当人们只在意少数选项时：使用广义 Top-k Mallows 模型进行采样、选择与学习

扰动输入，而非参数 — 在上下文赌博机中的特征扰动

SGD 如何学习最优传输映射：投影 SGD、受限强凸性与极小-极大速率

GSAC 解析：因果性与局部性如何使多智能体 RL 可扩展且快速自适应

角度引导 — 旋转 LLM 激活以引导行为：直观深入解析

为智能体照亮世界：ESCA 如何用场景图为具身 AI 提供落地感

夺回剪枝带走的东西：通过缺失组件补偿恢复LLM（RestoreLCC）

看见并说明原因：DEXTER 如何在无数据情况下结合扩散与大模型解释视觉模型

保留有效部分，修正其余：迁移学习如何帮助最小范数插值器泛化

更锋利的隐私之剑——f-DP 如何在去中心化网络中释放更强大的 AI

用经典统计学解锁稳健的 LLM 水印检测

OnlineSplatter：为运动世界打造的实时三维视觉

超越事实：LLM 如何将知识压缩为可复用的“属性”

Head Pursuit：揭示并编辑 AI 模型内部的“概念旋钮”

为什么公平的系统会造成不公平的结果——深入探讨感知偏见

我的机器人试图打开一个锁着的抽屉：为什么大语言模型需要面对现实

超越静态场景：ROGR如何利用AI在任何环境中重照明3D对象

那是你的模型吗？用“重写本”式记忆证明 AI 的身世

2025 ⁶⁹⁶

十一月 ⁵⁰

十月 ¹⁵⁹