2025  696

十一月  50

在线梯度变化如何在 Hölder 平滑性下解锁通用加速

2025-11 · 11 分钟 · 5422 字

EraseFlow:通过引导去噪轨迹擦除不需要的概念

2025-11 · 16 分钟 · 7811 字

当建议有用时:用不完美预测学习乘积分布

2025-11 · 12 分钟 · 5706 字

你需要多少自适应性?理解按需采样中的样本—轮次权衡

2025-11 · 13 分钟 · 6219 字

FlowFeat:教图像记住运动 — 高分辨率、运动感知的像素特征

2025-11 · 15 分钟 · 7388 字

揭开置信:KLASS 如何加速并稳定掩码扩散采样

2025-11 · 12 分钟 · 5654 字

从照片到物理:URDF-Anything 如何用 3D MLLM 构建可执行的数字孪生

2025-11 · 17 分钟 · 8241 字

超越偏好:AI 模型是否理解我们最深层的价值观?

2025-11 · 19 分钟 · 9418 字

PCA++ — 为什么将特征分散开能使对比式 PCA 对结构化噪声更稳健

2025-11 · 13 分钟 · 6506 字

CTRL-ALT-DECEIT:AI 智能体会破坏你的代码吗?深度解析

2025-11 · 9 分钟 · 4446 字

AI能发现新数学吗?教机器理解数学理论中的“有趣”

2025-11 · 7 分钟 · 3329 字

破解图 Transformer 的密码:统一理论与实践的框架

2025-11 · 10 分钟 · 4619 字

ATHENA:AI 如何融合符号数学与语言来预测你的个人选择

2025-11 · 9 分钟 · 4463 字

更聪明,而非更费力:LeMiCa 如何通过全局思维加速 AI 视频生成

2025-11 · 6 分钟 · 2948 字

更聪明,而非更费力:EPIC 如何教大语言模型选择最佳推理策略

2025-11 · 7 分钟 · 3317 字

解锁鲁棒的 3D 视觉:深入解析 Cycle-Sync

2025-11 · 8 分钟 · 3524 字

超越固定步长:前向曲率匹配如何解锁灵活的 3D 重建

2025-11 · 6 分钟 · 2982 字

快速找到所有优质模型:深入解析 SORTeD

2025-11 · 7 分钟 · 3057 字

解释之前先校准:深度剖析 ReCalX,构建可信赖的 AI

2025-11 · 7 分钟 · 3468 字

FAPEX:以分数阶微积分驯服脑电波,实现通用癫痫预测

2025-11 · 7 分钟 · 3250 字

现实的几何学:通过理解自然图像来检测 AI 生成图像

2025-11 · 6 分钟 · 2574 字

定位的极限:带噪距离查询能(和不能)揭示什么

2025-11 · 7 分钟 · 3485 字

虚拟宽度网络:突破二次瓶颈,扩展 Transformer

2025-11 · 6 分钟 · 2920 字

Depth Anything 3:单个 Transformer 看懂三维世界

2025-11 · 6 分钟 · 2879 字

为什么去噪模型应该真正去噪:深入解读 JiT

2025-11 · 7 分钟 · 3010 字

本地 AI 的崛起:用“每瓦智能”衡量并重塑云端

2025-11 · 7 分钟 · 3332 字

与陪练伙伴一起训练大语言模型:深入解析 RLAC

2025-11 · 7 分钟 · 3034 字

超越记忆:强化学习如何教会大语言模型导航知识

2025-11 · 7 分钟 · 3355 字

LLM 的贝叶斯大脑:提示与激活引导如何塑造模型信念

2025-11 · 6 分钟 · 2746 字

WebVIA:探索、编码并验证交互式网站的 AI 智能体

2025-11 · 9 分钟 · 4033 字

超越静态数据:LoopTool 的自校正循环如何打造更智能的 LLM 代理

2025-11 · 7 分钟 · 3206 字

在梦境中训练机器人:WMPO 如何教机器人从想象的失败中学习

2025-11 · 7 分钟 · 3142 字

思考快,表达准:TiDAR 如何解锁 6 倍 LLM 推理速度

2025-11 · 6 分钟 · 2947 字

大语言模型的钢丝——开发者如何在 AI 编程助手的机遇与风险间取得平衡

2025-11 · 7 分钟 · 3123 字

赋予LLM记忆:生成式语义工作空间如何帮助AI理解故事

2025-11 · 8 分钟 · 3747 字

超越置信度:KLASS 如何利用稳定性解锁更快、更优的扩散模型

2025-11 · 6 分钟 · 2704 字

从谱到信号原则:一个成本仅 8 千美元的小模型如何学会像 AI 巨头一样推理

2025-11 · 6 分钟 · 2998 字

我的AI记得什么?揭示AI记忆中隐藏的幻觉

2025-11 · 8 分钟 · 3646 字

藏于无形:NINJA 攻击如何利用长上下文绕过大语言模型安全机制

2025-11 · 7 分钟 · 3179 字

超越离散思维:SofT-GRPO 如何让 LLM 在连续空间中推理

2025-11 · 5 分钟 · 2250 字

超越上下文窗口:IterResearch 如何教 AI 智能体思考、综合并攻克复杂问题

2025-11 · 8 分钟 · 3625 字

Dr. MAMR:如何让 AI 智能体不再“偷懒”,提升协同推理能力

2025-11 · 7 分钟 · 3182 字

用人工智能解锁数学发现:深入剖析 AlphaEvolve

2025-11 · 11 分钟 · 5111 字

超越智能体级搜索:工具到智能体检索如何为 LLM 系统赋能

2025-11 · 6 分钟 · 2792 字

DreamGym:在合成世界中训练 AI 智能体,以掌控真实世界

2025-11 · 7 分钟 · 3441 字

超越正确答案:深入解读 IMO-Bench,人工智能数学能力的新黄金标准

2025-11 · 7 分钟 · 3345 字

Transformer 能中彩票吗?一项新证明在注意力机制中找到了中奖彩票

2025-11 · 7 分钟 · 3138 字

交叉点:在数据稀缺的世界中,扩散模型如何超越大型语言模型

2025-11 · 8 分钟 · 3665 字

超越视觉:V-Thinker 如何教 AI 与图像交互以实现更深层次的推理

2025-11 · 7 分钟 · 3409 字

Sora-2 会思考吗?探索“以视频为思考”的新范式

2025-11 · 7 分钟 · 3362 字

十月  159

当直线失效:梯度方差如何揭露整流流中的记忆化

2025-10 · 16 分钟 · 7778 字

TrajMamba 解读:快速、目的感知的车辆轨迹嵌入

2025-10 · 16 分钟 · 7886 字

Teaching Machines to ‘See’ Space: Grid-Based Spatial Intelligence for Autonomous Driving

2025-10 · 14 分钟 · 6646 字

像拼乐高一样拼接计划:C‑MCTD 如何让扩散规划器进行全局思考

2025-10 · 18 分钟 · 8955 字

Diff-ABFlow — 用帧+事件融合与扩散解决模糊与夜间光流

2025-10 · 15 分钟 · 7345 字

一步到位:岭提升如何同时实现稳健性与半参数效率

2025-10 · 13 分钟 · 6074 字

教会模型选择性地遗忘:视觉-语言模型的近似领域遗忘

2025-10 · 15 分钟 · 7493 字

读懂(驾驶者的)思维:使用注意力感知的逆向规划从动作推断注意力偏差

2025-10 · 17 分钟 · 8413 字

拉伸表示:最小生成树如何帮助自监督学习

2025-10 · 17 分钟 · 8070 字

当人们只在意少数选项时:使用广义 Top-k Mallows 模型进行采样、选择与学习

2025-10 · 14 分钟 · 6662 字

扰动输入,而非参数 — 在上下文赌博机中的特征扰动

2025-10 · 9 分钟 · 4458 字

SGD 如何学习最优传输映射:投影 SGD、受限强凸性与极小-极大速率

2025-10 · 14 分钟 · 6724 字

GSAC 解析:因果性与局部性如何使多智能体 RL 可扩展且快速自适应

2025-10 · 11 分钟 · 5123 字

角度引导 — 旋转 LLM 激活以引导行为:直观深入解析

2025-10 · 17 分钟 · 8024 字

为智能体照亮世界:ESCA 如何用场景图为具身 AI 提供落地感

2025-10 · 16 分钟 · 7652 字

2025-10 · 13 分钟 · 6336 字

夺回剪枝带走的东西:通过缺失组件补偿恢复LLM(RestoreLCC)

2025-10 · 11 分钟 · 5407 字

看见并说明原因:DEXTER 如何在无数据情况下结合扩散与大模型解释视觉模型

2025-10 · 12 分钟 · 5532 字

保留有效部分,修正其余:迁移学习如何帮助最小范数插值器泛化

2025-10 · 12 分钟 · 5705 字

更锋利的隐私之剑——f-DP 如何在去中心化网络中释放更强大的 AI

2025-10 · 7 分钟 · 3340 字

用经典统计学解锁稳健的 LLM 水印检测

2025-10 · 6 分钟 · 2916 字

OnlineSplatter:为运动世界打造的实时三维视觉

2025-10 · 7 分钟 · 3371 字

超越事实:LLM 如何将知识压缩为可复用的“属性”

2025-10 · 7 分钟 · 3277 字

Head Pursuit:揭示并编辑 AI 模型内部的“概念旋钮”

2025-10 · 7 分钟 · 3207 字

为什么公平的系统会造成不公平的结果——深入探讨感知偏见

2025-10 · 10 分钟 · 4776 字

我的机器人试图打开一个锁着的抽屉:为什么大语言模型需要面对现实

2025-10 · 7 分钟 · 3505 字

超越静态场景:ROGR如何利用AI在任何环境中重照明3D对象

2025-10 · 7 分钟 · 3145 字

那是你的模型吗?用“重写本”式记忆证明 AI 的身世

2025-10 · 7 分钟 · 3008 字

为什么更多通信有助于(但无法完全解决)去中心化学习:理解多步 Gossip

2025-10 · 7 分钟 · 3202 字

HEDGE已是最佳选择?——深入探讨组合在线学习

2025-10 · 8 分钟 · 3739 字

驯服长尾:深入解析信息保持的两阶段学习

2025-10 · 7 分钟 · 3333 字

旋度下降:当“横向移动”能帮助神经网络更快学习时

2025-10 · 8 分钟 · 3562 字

解锁大脑‘黑箱’:雅可比矩阵如何揭示非线性视觉处理

2025-10 · 8 分钟 · 3572 字

EPHAD:让异常检测从真实世界的数据污染中获救

2025-10 · 7 分钟 · 3186 字

驯服延迟怪兽——当反馈姗姗来迟时的智能决策

2025-10 · 7 分钟 · 3167 字

从分数到谱分布:补全不确定知识图谱的新方法

2025-10 · 7 分钟 · 3020 字

AI 的大脑 GPS:网格状编码如何构建更智能的世界模型

2025-10 · 7 分钟 · 3419 字

消失于无形:深入解析针对 SAM2 的对抗攻击

2025-10 · 7 分钟 · 3016 字

冗余悖论:掩盖旧数据如何改进时间序列预测

2025-10 · 6 分钟 · 2901 字

超越像素——利用物理定律揭示AI生成视频

2025-10 · 8 分钟 · 3657 字

鱼与熊掌兼得:混合平衡 GFlowNet 如何攻克车辆路径问题

2025-10 · 7 分钟 · 3059 字

教 AI 看你所看:深入解析条件表征学习

2025-10 · 7 分钟 · 3360 字

别那样做!用未来视野和人类直觉教机器人

2025-10 · 7 分钟 · 3069 字

稀疏性的形状:Graphon 如何揭示神经网络剪枝的秘密

2025-10 · 8 分钟 · 3807 字

LLM 黑客攻击的普适定律:用“每查询比特数”衡量安全

2025-10 · 7 分钟 · 3093 字

贝尔曼–詹森差距:解锁强化学习中预测的真正价值

2025-10 · 8 分钟 · 3769 字

超越像素:SegMASt3R 如何精通 3D 感知分割匹配

2025-10 · 7 分钟 · 3466 字

超越精美图片:利用数据增强进行因果推断

2025-10 · 7 分钟 · 3466 字

超越全上下文:Memo 如何为 Transformer 打造更智能、更精简的记忆

2025-10 · 7 分钟 · 3142 字

一个模型应对所有场景:MDReID 如何破解目标重识别中的模态混合与匹配难题

2025-10 · 6 分钟 · 2886 字

超越上下文窗口:Vgent 的图驱动长视频理解方法

2025-10 · 7 分钟 · 3274 字

用“能量”解决复杂难题:人工智能如何学会超越训练数据的推理能力

2025-10 · 7 分钟 · 3269 字

超越 LoRA:利用 StelLA 和几何优化学习更好的子空间

2025-10 · 7 分钟 · 3128 字

ReCon:教扩散模型在“框框”里涂色,实现更好的目标检测

2025-10 · 6 分钟 · 2963 字

DiPro:人工智能如何通过分离信号与噪声来追踪疾病

2025-10 · 7 分钟 · 3123 字

聚类混沌:DynaInfer 如何学习分离和泛化动力系统

2025-10 · 6 分钟 · 2760 字

教脉冲无人机飞行:自适应梯度与“跳跃启动”强化学习

2025-10 · 7 分钟 · 3476 字

流畅动作的秘密:解读用于长运动生成的组合式相位扩散模型

2025-10 · 6 分钟 · 2939 字

Transformer 训练的两阶段:从凝聚到秩坍塌

2025-10 · 7 分钟 · 3447 字

填补泛化理论的漏洞——随机投影与压缩如何修复 CMI 界

2025-10 · 9 分钟 · 4444 字

超越平面世界:利用 HyperET 在双曲空间中训练更智能的多模态 AI

2025-10 · 7 分钟 · 3212 字

噪声究竟如何扭曲你的数据?以更锐利的视角审视低秩近似

2025-10 · 7 分钟 · 3370 字

你的数据“形状”有多脆弱?深入探索噪声下的低秩近似

2025-10 · 7 分钟 · 3193 字

万物皆热核:统一组合贝叶斯优化的狂野西部

2025-10 · 7 分钟 · 3251 字

FunLoRA:让 AI 永远学习而不遗忘的巧妙技巧

2025-10 · 7 分钟 · 3261 字

抛弃键与值:通往终身学习的极简主义之路

2025-10 · 7 分钟 · 3317 字

解码上下文学习:为什么 Transformer 可能是隐藏的贝叶斯统计学家

2025-10 · 7 分钟 · 3219 字

超越对错:教LLM判断自身置信度

2025-10 · 7 分钟 · 3096 字

超越百万词元:为长上下文大语言模型构建真实测试与真实记忆

2025-10 · 8 分钟 · 3594 字

超越文本:强化学习与工具如何打造更智能的 LLM 评委

2025-10 · 7 分钟 · 3226 字

从原始计算机到超人 AI:情境工程的隐藏历史与未来

2025-10 · 8 分钟 · 3566 字

超越集合通信:TransferEngine 如何为现代大语言模型解锁可移植的高速通信

2025-10 · 7 分钟 · 3290 字

LLM 微调不稳定的真正罪魁祸首?可能是你的浮点数。

2025-10 · 8 分钟 · 3730 字

Agent Data Protocol:训练更智能 LLM 智能体的通用翻译器

2025-10 · 7 分钟 · 3420 字

AI 们为何意见不合?压力测试它们背后的规则手册

2025-10 · 7 分钟 · 3434 字

超越顺序思维:基于图的规划如何为 LLM 智能体解锁并行能力

2025-10 · 7 分钟 · 3138 字

你的AI懂了吗?一项新的全球基准如何测试116种语言的AI常识

2025-10 · 9 分钟 · 4426 字

提出、解决、评判:单一 LLM 如何通过自我进化学会推理

2025-10 · 6 分钟 · 2912 字

AgentFold:通过整理工作空间,让 AI 像人类一样思考

2025-10 · 7 分钟 · 3392 字

芯片上的衔尾蛇:循环语言模型如何学会“更深”而非“更广”地思考

2025-10 · 9 分钟 · 4463 字

超越模仿:使用 PORTool 教会大语言模型探索与推理工具

2025-10 · 7 分钟 · 3241 字

超越模仿:用监督强化学习教大语言模型进行分步推理

2025-10 · 7 分钟 · 3103 字

超越思维链:异步思考如何解锁协作式人工智能

2025-10 · 6 分钟 · 2851 字

OmniX:利用 AI 将单张图像转变为可交互的 3D 世界

2025-10 · 7 分钟 · 3154 字

ORCA:如何用图像生成器教机器人

2025-10 · 6 分钟 · 2985 字

隆重推出 AMO-Bench:AI 数学推理的全新试炼场

2025-10 · 7 分钟 · 3192 字

Emu3.5:十年视频训练如何教会 AI 理解我们的世界

2025-10 · 10 分钟 · 4701 字

超越 Softmax:Kimi Linear 如何重新定义大语言模型的效率与性能

2025-10 · 8 分钟 · 3696 字

AutoDeco:教语言模型自我引导,无需手动调参

2025-10 · 7 分钟 · 3014 字

头碰头:简单的头间通信如何改进 Transformer 模型

2025-10 · 6 分钟 · 2688 字

超越检索:E²RANK 如何将文本嵌入模型变为强大的重排器

2025-10 · 7 分钟 · 3388 字

超越重建:IGGT 如何让 AI 像人类一样理解三维场景

2025-10 · 8 分钟 · 3641 字

追逐幻影:‘前瞻锚定’如何解决 AI 生成视频中的身份漂移问题

2025-10 · 7 分钟 · 3020 字

FARMER:用自回归流播下下一代图像生成的种子

2025-10 · 4 分钟 · 1619 字

从助手到自主科学家:数据智能体未来发展的六级指南

2025-10 · 9 分钟 · 4150 字

ReCode:统一规划与行动,打造更智能、更具适应性的 AI 智能体

2025-10 · 6 分钟 · 2883 字

超越平面世界:Concerto如何通过融合视觉与触觉教机器看懂3D

2025-10 · 6 分钟 · 2920 字

解锁 AI 视频的创意控制:深入解析 Video-As-Prompt (VAP) 框架

2025-10 · 7 分钟 · 3283 字

DeepAgent:教会 AI 自主思考、发现工具并独立解决复杂问题

2025-10 · 7 分钟 · 3396 字

超越简单滤镜:Pico-Banana-400K 如何训练更智能的 AI 图像编辑器

2025-10 · 7 分钟 · 3126 字

WorldGrow:逐块构建无限、逼真的3D世界

2025-10 · 7 分钟 · 3360 字

打破错误级联:ReDiff 如何教会 AI 纠正自身错误

2025-10 · 6 分钟 · 2826 字

从“步”到“块”:强化学习如何让 AI 图像生成更智能

2025-10 · 7 分钟 · 3163 字

超越准确率:深入剖析 HAL,AI 智能体评估的新标准

2025-10 · 9 分钟 · 4273 字

HERO:融合稀疏规则与密集奖励,增强 LLM 的推理能力

2025-10 · 7 分钟 · 3119 字

Dr.LLM 简介:通过动态层路由升级 LLM,实现更高准确率与更低计算量

2025-10 · 7 分钟 · 3336 字

Elastic-Cache:通过重新思考 KV 缓存,让扩散大语言模型快如闪电

2025-10 · 6 分钟 · 2816 字

AI 团队协作的秘密:揭示 LLM 智能体中的涌现协同效应

2025-10 · 7 分钟 · 3207 字

如何训练更聪明的 AI 智能体:深入解析智能体强化学习

2025-10 · 7 分钟 · 3317 字

从艺术到科学:扩展大型语言模型强化学习的原则性指南

2025-10 · 7 分钟 · 3181 字

超越黑箱:可控 AI 智能体如何革新企业研究

2025-10 · 8 分钟 · 3637 字

Prompt-MII:教大语言模型自己写指令,推理成本降低 13 倍

2025-10 · 7 分钟 · 3175 字

超越自动化:ColorAgent 如何将你的手机 AI 变为真正的伙伴

2025-10 · 7 分钟 · 3355 字

Ring-1T:走进重新定义推理的万亿参数 AI 内部

2025-10 · 7 分钟 · 3007 字

窥探未来:‘Lookahead 路由’如何让大模型做出更智能的选择

2025-10 · 7 分钟 · 3430 字

解锁你 LLM 的隐藏天赋:无需训练

2025-10 · 7 分钟 · 3025 字

修复 LLM 的遗忘症:深入解析稀疏记忆微调

2025-10 · 6 分钟 · 2989 字

AI 也会得“脑腐”吗?垃圾数据如何让大语言模型变笨

2025-10 · 7 分钟 · 3064 字

QeRL:将量化噪声转化为推理型 LLM 的超能力

2025-10 · 7 分钟 · 3070 字

超越 VAE:表征自编码器成为扩散 Transformer 的新默认方案

2025-10 · 6 分钟 · 2703 字

超越视觉与听觉:深入解析 OmniVinci 的全模态 AI

2025-10 · 7 分钟 · 3191 字

Nano3D:无需训练或掩码,轻松实现一致的3D编辑

2025-10 · 8 分钟 · 3581 字

BLIP3o-NEXT:混合式 AI 架构如何重新定义图像生成与编辑

2025-10 · 6 分钟 · 2974 字

LightsOut:AI 如何通过绘制不存在之物在黑暗中视物

2025-10 · 7 分钟 · 3234 字

Skyfall-GS: 用 AI 从太空构建沉浸式 3D 城市

2025-10 · 7 分钟 · 3301 字

Ditto 与 Editto:百万合成视频如何革新 AI 视频编辑

2025-10 · 7 分钟 · 3081 字

几个坏例子如何带坏一个大语言模型:上下文学习的隐藏危险

2025-10 · 6 分钟 · 2742 字

告别 VAE:自监督特征如何为扩散模型强势赋能

2025-10 · 7 分钟 · 3173 字

更智能、更快速、更强大:一种全新的 LLM 推理理论框架

2025-10 · 7 分钟 · 3067 字

无用功:DeepPrune 如何将大语言模型推理成本削减超过 80%

2025-10 · 6 分钟 · 2949 字

不止于正确:为什么你的 AI 编程助手需要一次“感觉检查”

2025-10 · 7 分钟 · 3154 字

学会学习,一次一批:深入解析迭代式摊销推断

2025-10 · 6 分钟 · 2810 字

HyperAdaLoRA:由超网络驱动的升级,实现更快、更智能的 LLM 微调

2025-10 · 6 分钟 · 2804 字

超越思维链:并行思考与自我优化如何解锁更智能的 LLM

2025-10 · 7 分钟 · 3289 字

AgentFlow:训练大语言模型智能体高效思考、规划与使用工具

2025-10 · 7 分钟 · 3415 字

教 AI 思考、回溯和重试:深入解读 MM-HELIX

2025-10 · 5 分钟 · 2372 字

超越模仿:早期经验如何让智能体从自身错误中学习

2025-10 · 8 分钟 · 3913 字

MemMamba:教 AI“记笔记”,攻克超长序列难题

2025-10 · 7 分钟 · 3313 字

超越第一帧:介绍用于任意视频创作的 VideoCanvas

2025-10 · 7 分钟 · 3075 字

DreamOmni2:教 AI 用文字和图片编辑与创作图像

2025-10 · 7 分钟 · 3116 字

超越文本到视频:UniVideo 如何统一理解、生成与编辑

2025-10 · 7 分钟 · 3291 字

MASA:教AI模型‘思考自己的思考’

2025-10 · 6 分钟 · 2564 字

超越更长上下文:教长上下文语言模型用可复用推理进行思考

2025-10 · 6 分钟 · 2813 字

推理火花:微小概率如何解锁 AI 的超强解题能力

2025-10 · 5 分钟 · 2502 字

ARTDECO:融合 SLAM 与基础模型,打造完美的即时 3D 世界

2025-10 · 6 分钟 · 2524 字

受大脑启发的 AI:人工海马体网络如何赋予大语言模型长期记忆

2025-10 · 6 分钟 · 2677 字

为什么 AI 助手是糟糕的模拟用户——以及“翻转对话”如何解决这个问题

2025-10 · 7 分钟 · 3028 字

忘掉像素,生成代码:深入解读 Code2Video 如何创作教育视频

2025-10 · 6 分钟 · 2652 字

一个智能体很好,十个更好:扩展策略如何解锁AI计算机助手的近人类性能

2025-10 · 6 分钟 · 2968 字

少即是多:微型递归网络如何在复杂谜题上超越巨型 AI 模型

2025-10 · 7 分钟 · 3111 字

人工智能领域的龟兔赛跑:渐进式学习如何让视觉 AI 更快

2025-10 · 6 分钟 · 2601 字

RECAP:通过展示有缺陷的推理来教 AI 批判性思考

2025-10 · 6 分钟 · 2629 字

中段训练即可满足全部需求:一个 15B 模型如何触及 AI 前沿

2025-10 · 6 分钟 · 2903 字

LongCodeZip:让大语言模型读懂你的整个代码库,还不用花大钱

2025-10 · 6 分钟 · 2539 字

藏于虚空:StealthAttack 如何对 3D 场景进行投毒

2025-10 · 6 分钟 · 2759 字

小而强大:ModernVBERT 如何重新定义视觉文档检索

2025-10 · 3 分钟 · 1423 字

从秒到分钟:Self-Forcing++ 如何教会 AI 生成长视频

2025-10 · 6 分钟 · 2618 字

AI 能战胜华尔街吗?用 STOCKBENCH 在股市中测试 LLM 代理

2025-10 · 5 分钟 · 2505 字

别浪费你的错误:智能经验回放如何解锁大语言模型的推理能力

2025-10 · 6 分钟 · 2722 字

九月  82

用聪明的干预破解循环:线性非高斯模型的近最优实验设计

2025-09 · 12 分钟 · 5853 字

Neptune-X — 教会视觉模型看见大海:用于更好海事检测的生成数据 + 智能抽样

2025-09 · 14 分钟 · 6651 字

形式胜过含义:大型语言模型如何学会将句法与领域关联

2025-09 · 15 分钟 · 7125 字

移位的后继:为什么跳过几步能让低秩强化学习奏效

2025-09 · 6 分钟 · 2898 字

教单一大模型进行检索与推理:剖析 AceSearcher 的协同自我对弈

2025-09 · 16 分钟 · 7940 字

让流更短:CAR‑Flow 如何让生成模型停止原地打转

2025-09 · 13 分钟 · 6397 字

当预测调参对推断失效时:针对期望条件协方差的去偏与岭回归最优选择

2025-09 · 15 分钟 · 7188 字

进度条来拯救:微小信号如何帮助调度未知作业

2025-09 · 12 分钟 · 5513 字

LSD 与 LSD+:教快速采样器模仿慢而稳的采样器 — 关于离散扩散中可学习采样器蒸馏的温和导览

2025-09 · 11 分钟 · 5406 字

读完整个电影:功能缩放定律、内在时间,以及为什么 Warmup–Stable–Decay 有效

2025-09 · 17 分钟 · 8369 字

让 Do-SHAP 可用:估计量无关的因果解释与快速前缘技巧

2025-09 · 11 分钟 · 5135 字

DexFlyWheel — 将一次演示转化为成千上万类人类的灵巧机器人技能

2025-09 · 12 分钟 · 5938 字

EvoBrain:动态大脑网络如何帮助预测癫痫发作

2025-09 · 7 分钟 · 3382 字

HyPINO:训练一个神经算子,解决所有问题

2025-09 · 7 分钟 · 3462 字

从“整理”到3D场景:MesaTask如何教AI生成任务就绪的环境

2025-09 · 6 分钟 · 2844 字

WeSCon:教AI在句子中切换情感

2025-09 · 7 分钟 · 3170 字

初识 Orochi:驯服生物医学图像处理的多头蛇

2025-09 · 7 分钟 · 3388 字

超越删除:GeoRemover 如何擦除物体及其恼人的阴影

2025-09 · 6 分钟 · 2907 字

超越对角:利用结构化稀疏性释放状态空间模型的全部潜力

2025-09 · 8 分钟 · 3857 字

毒物如何传播:深入剖析大语言模型中的‘病毒感染攻击’

2025-09 · 6 分钟 · 2897 字

搭建通往更优设计的桥梁:ROOT 如何重新定义离线优化

2025-09 · 7 分钟 · 3137 字

从单个视频到 3D 动画木偶:深入解析 Stable Part Diffusion 4D

2025-09 · 7 分钟 · 3301 字

超越自回归:卷积与拒绝机制如何使扩散语言模型更快更流畅

2025-09 · 7 分钟 · 3086 字

GeoSVR:超越高斯溅射,以几何精确的稀疏体素重建表面

2025-09 · 6 分钟 · 3003 字

更少代价,更强隐私:草图如何在联邦学习中放大隐私保护

2025-09 · 9 分钟 · 4310 字

超越表达能力:衡量图神经网络威力的新方法

2025-09 · 8 分钟 · 3927 字

不错过任何一帧:深入解析 StreamForest 面向视频 AI 的事件记忆机制

2025-09 · 7 分钟 · 3136 字

D-Gating:让神经网络更小更快的可微技巧

2025-09 · 7 分钟 · 3059 字

超越利普希茨极限:非线性预处理如何帮助我们逃离鞍点

2025-09 · 7 分钟 · 3497 字

AI 自噬:为何生成模型正忘记如何创新

2025-09 · 6 分钟 · 2988 字

理解注意力机制:一个兼具速度与可解释性的新框架

2025-09 · 7 分钟 · 3135 字

超越冗余:InfMasking 如何教会 AI 理解协同作用

2025-09 · 7 分钟 · 3129 字

Mamba的盲点:为什么对称性是它的阿喀琉斯之踵

2025-09 · 8 分钟 · 4007 字

Mind the Glitch:AI 终于能够发现并修复生成图像中的不一致之处

2025-09 · 6 分钟 · 2832 字

为蛋白质设计提速:SpecMER 如何利用进化线索更快地生成更好的蛋白质

2025-09 · 7 分钟 · 3326 字

MAESTRO:指挥传感器数据的交响乐,即使乐器失声

2025-09 · 8 分钟 · 3624 字

超越COLMAP:ROS-Cam如何从日常视频中解锁4D场景

2025-09 · 7 分钟 · 3189 字

揭穿 AI 纹理偏见的神话:神经网络究竟如何看待世界

2025-09 · 8 分钟 · 3653 字

破解 GNN 黑箱:GNNXEMPLAR 如何用 AI 以通俗语言解释 AI

2025-09 · 7 分钟 · 3475 字

Transformer AI 的三幕剧:词元如何对齐、聚类与合并

2025-09 · 7 分钟 · 3124 字

重访平坦之地:在混合专家模型的损失地貌中寻找线性连接

2025-09 · 9 分钟 · 4485 字

超越人类反馈:基础模型如何通过 PRIMT 教会机器人

2025-09 · 7 分钟 · 3081 字

Dreamer 4:AI 如何通过做梦学会在《我的世界》中获得钻石

2025-09 · 8 分钟 · 3926 字

大语言模型能像我们一样持续学习吗?深入探讨情境持续学习

2025-09 · 7 分钟 · 3139 字

超越炒作:Kimi-Dev 如何连接人工智能软件工程的两个世界

2025-09 · 7 分钟 · 3121 字

超越 Hessian:深度学习中数据影响的贝叶斯视角

2025-09 · 8 分钟 · 3899 字

AI 智能体准备好迎接真实世界了吗?深入解析 MCPMark 基准测试

2025-09 · 9 分钟 · 4114 字

超越思维链:揭示大语言模型的静默推理

2025-09 · 10 分钟 · 4592 字

ChemMAS:教 AI 像化学家一样推理

2025-09 · 8 分钟 · 3546 字

演化反击:一种出乎意料且强大的 LLM 微调方法

2025-09 · 5 分钟 · 2196 字

龙之幼雏:连接 Transformer 与大脑的新型 AI 架构

2025-09 · 10 分钟 · 4691 字

背包 RL:训练更智能语言模型的一场计算“免费午餐”

2025-09 · 5 分钟 · 2370 字

超越数学谜题:教大语言模型“思考”如何释放卓越的聊天性能

2025-09 · 6 分钟 · 2748 字

初识 ARK-V1:一个能导航知识图谱以实现更智能问答的 LLM 代理

2025-09 · 6 分钟 · 2941 字

LLM能从计算机视觉中学到什么?LLM-JEPA简介

2025-09 · 6 分钟 · 2577 字

教语言模型三思而后行:深入解析 PDDL-INSTRUCT 框架

2025-09 · 5 分钟 · 2476 字

一个分词器统一所有?深入解析 ATOKEN 如何处理图像、视频和 3D

2025-09 · 6 分钟 · 2756 字

超越 ReAct 循环:使用 ARE 和 Gaia2 构建与测试更智能的 AI 智能体

2025-09 · 7 分钟 · 3149 字

AgentScaler:如何通过扩展环境(而非仅仅模型)来解锁高级 AI 智能体

2025-09 · 5 分钟 · 2163 字

抛开炒作:LLM 究竟是在学习还是在记忆?深入探讨上下文学习

2025-09 · 5 分钟 · 2477 字

GP-hy-T:通用物理引擎的黎明?

2025-09 · 6 分钟 · 2568 字

超越谷歌:DeepDive 如何教大语言模型成为专家级研究员

2025-09 · 6 分钟 · 2701 字

K2-THINK:320亿参数模型如何越级挑战AI巨头

2025-09 · 5 分钟 · 2301 字

在刀尖上平衡:人工智能如何发现流体动力学中难以捉摸的奇点

2025-09 · 7 分钟 · 3376 字

超越多数原则:训练大语言模型从多个猜测中综合出最佳答案

2025-09 · 6 分钟 · 2752 字

当多个 AI 大脑不如一个:AI 辩论的隐藏危险

2025-09 · 6 分钟 · 2762 字

打破大语言模型的“隧道视野”:深入解读 ParaThinker 的并行推理

2025-09 · 6 分钟 · 2938 字

实践出真知:AgentGym-RL 如何教大语言模型解决真实世界问题

2025-09 · 6 分钟 · 2809 字

超越“足够好”:ACE-RL 如何教大语言模型掌握长文本写作

2025-09 · 6 分钟 · 2726 字

REFRAG:为 RAG 超级加速,首个 token 生成速度提升 30 倍

2025-09 · 6 分钟 · 2545 字

大型语言模型如何学会思考——解析人工智能中的层次化推理

2025-09 · 5 分钟 · 2492 字

超越单尺度:解析 SINQ,实现更好、更快的大语言模型量化

2025-09 · 5 分钟 · 2461 字

超越聊天机器人:强化学习如何打造自主 AI 研究员

2025-09 · 6 分钟 · 2661 字

HuMo: 让文本、图像和语音完美协同的视频生成模型

2025-09 · 6 分钟 · 2853 字

小模型,大突破:VLA-Adapter 如何将机器人大脑缩小 14 倍

2025-09 · 4 分钟 · 1955 字

SAPO:群体智能训练——AI 模型如何通过经验共享加速 94% 学习

2025-09 · 6 分钟 · 2577 字

让AI像研究员一样浏览网页:打造超人类网络代理的两阶段方法

2025-09 · 5 分钟 · 2487 字

逆向推理:让小模型学会像作家一样思考

2025-09 · 6 分钟 · 2697 字

沉默的思考:大语言模型如何在内部进行推理

2025-09 · 7 分钟 · 3113 字

掌控 AI 研究助手:自定义模型与策略

2025-09 · 5 分钟 · 2340 字

Drivelology: 当 AI 遇上「深度废话」

2025-09 · 6 分钟 · 2711 字

UI-TARS-2: 通过强化学习训练AI掌控计算机的四大支柱

2025-09 · 5 分钟 · 2363 字

八月  23

DINOZAUR:一个更精简、更可靠的复杂物理神经算子

2025-08 · 6 分钟 · 2969 字

从静态网格到动态动画:深入解析Puppeteer

2025-08 · 8 分钟 · 3933 字

DeltaFlow:一种更智能、更快速的 3D 点云运动感知方法

2025-08 · 6 分钟 · 2669 字

用更少的数据玩转多目标——无标签数据如何驾驭复杂模型

2025-08 · 11 分钟 · 5293 字

你能预测未来吗?如果只能在周二尝试呢?

2025-08 · 8 分钟 · 3779 字

引导机器人重回正轨:深度解析潜在策略屏障

2025-08 · 8 分钟 · 3705 字

一个模型,多种任务:基于算子的 AI 如何同时实现图像修复、去噪和路径规划

2025-08 · 7 分钟 · 3420 字

解码复杂系统:一种用于发现因果循环与隐藏影响的新型人工智能框架

2025-08 · 7 分钟 · 3183 字

OpenCUA:构建能像你一样使用计算机的开源 AI 智能体

2025-08 · 8 分钟 · 3884 字

驯服混沌:信任域如何引导 AI 解决复杂问题

2025-08 · 9 分钟 · 4451 字

杀鸡焉用牛刀:为大语言模型设计智能、成本感知的路由

2025-08 · 8 分钟 · 3533 字

SmallKV:小小助手如何让大语言模型运行得更快、更轻巧

2025-08 · 6 分钟 · 2680 字

DINOZAUR:傅里叶神经算子的更精简、更确定的继任者

2025-08 · 7 分钟 · 3152 字

揭开对抗攻击的面纱:神经网络如何通过叠加态欺骗自己

2025-08 · 6 分钟 · 2996 字

Agent Lightning:训练任何 AI 代理所缺失的一环

2025-08 · 5 分钟 · 2215 字

GPU 的“奇点”已过:欢迎来到多任务时代

2025-08 · 7 分钟 · 3323 字

超越从左到右:介绍 Dream 7B,一款强大的新型扩散式大语言模型

2025-08 · 7 分钟 · 3164 字

WebWatcher:训练 AI 智能体像专业研究员一样看、读、推理

2025-08 · 4 分钟 · 1981 字

考验 AI 智能体:深入 LiveMCP-101 的真实世界挑战

2025-08 · 6 分钟 · 2877 字

PILOT:既会学习又省钱的智能大模型路由

2025-08 · 5 分钟 · 2472 字

搜索的数学极限:为什么完美的AI也无法检索一切

2025-08 · 6 分钟 · 2541 字

rStar2-Agent: 教会 AI 更聪明地思考,而非更冗长地推理

2025-08 · 5 分钟 · 2245 字

AI视觉模型如何学会像人类一样看世界:通往类脑智能的三把钥匙

2025-08 · 5 分钟 · 2180 字

七月  27

更大确实学得更好:规模如何解锁神经网络的组合泛化

2025-07 · 10 分钟 · 4671 字

从网格到力学:PhysX-3D 如何教会 3D 生成器关注物理

2025-07 · 13 分钟 · 6218 字

Talk2Event — 用事件的语言说话:在异步视觉中将自然语言落地

2025-07 · 14 分钟 · 6835 字

Segment Anything — 在开放世界中:OpenWorldSAM 如何为 SAM2 添加语言和实例感知

2025-07 · 13 分钟 · 6018 字

为什么 BFGS 真正有效:在无强凸性下的全局、仿射不变速率

2025-07 · 11 分钟 · 5396 字

当视觉-语言模型失去线索:探测非局部视觉推理

2025-07 · 12 分钟 · 5597 字

破解多语性诅咒:Meta CLIP 2 如何将 CLIP 扩展到全球网络

2025-07 · 10 分钟 · 4920 字

聆听、观察、移动:AI 如何学习从 3D 声音中生成人体运动

2025-07 · 8 分钟 · 3624 字

超越贪心搜索:释放 AI 研究智能体的力量

2025-07 · 7 分钟 · 3466 字

打破水印的权衡困境:深入解析 SEEK 如何实现强大的 LLM 保护

2025-07 · 7 分钟 · 3185 字

超越“好”与“坏”:清单如何教会大语言模型真正遵循指令

2025-07 · 7 分钟 · 3105 字

随流而动:构建理解运动的 RNN

2025-07 · 7 分钟 · 3163 字

更少数据,更多细节:CLiFT 如何革新神经渲染

2025-07 · 7 分钟 · 3237 字

超越对齐:SIU3R 如何统一三维场景重建与理解

2025-07 · 7 分钟 · 3043 字

初识 Audio Flamingo 3:一款前所未有的全开放人工智能,能听、会想、善聊

2025-07 · 9 分钟 · 4421 字

给 AI 踩刹车:如何控制推理模型的“思考速度”

2025-07 · 6 分钟 · 2643 字

我的模型学对了吗?介绍用于验证神经后验的 CoLT

2025-07 · 7 分钟 · 3264 字

自主掌控的协作式 AI:FLEXOLMO 简介

2025-07 · 7 分钟 · 3315 字

REG:让扩散 Transformer 训练速度提升 63 倍的简单技巧

2025-07 · 6 分钟 · 2587 字

FedCBDR:全局视角与智能缩放如何攻克联邦增量学习中的类别失衡问题

2025-07 · 6 分钟 · 2981 字

ElasticMM 如何大幅缩短 GPT‑4o 等视觉语言模型的等待时间

2025-07 · 7 分钟 · 3024 字

扩展记忆:为什么记忆马赛克 v2 在即时学习方面优于 Transformer

2025-07 · 8 分钟 · 3570 字

FlexOlmo:协作构建强大 AI——无需共享私有数据

2025-07 · 7 分钟 · 3300 字

释放 BFGS 的力量:无需常规假设的快速收敛

2025-07 · 7 分钟 · 3257 字

超越大数据:小而多样的数据集能教会 Transformer 更好地泛化吗?

2025-07 · 11 分钟 · 5368 字

想得越多,问题越多?当额外计算削弱大语言模型鲁棒性时

2025-07 · 7 分钟 · 3077 字

超越猜测:WebShaper 如何以数学精度打造更聪明的 AI 网络智能体

2025-07 · 5 分钟 · 2495 字

六月  96

为什么 ChebNet 值得重返舞台 —— 以及 Stable-ChebNet 如何修复其在长距离任务中的不稳定动力学

2025-06 · 15 分钟 · 7261 字

曲率来拯救:几何如何使高维下的激励探索高效

2025-06 · 13 分钟 · 6175 字

变分学习如何降低锐度:面向贝叶斯训练的稳定性边缘理论友好导览

2025-06 · 10 分钟 · 4990 字

如何以正确的方式增强二次规划:KKT 感知变换与对比预训练

2025-06 · 20 分钟 · 9933 字

教语言模型以3D思维:深入解析 ShapeLLM-Omni

2025-06 · 19 分钟 · 9108 字

G-Memory:教会多智能体团队记忆 — 深入解析用于大型语言模型代理的分层记忆

2025-06 · 23 分钟 · 11254 字

自我强迫视频扩散:教模型与自身错误共存

2025-06 · 15 分钟 · 7469 字

通过观察人类教机器人:面向对象的三维运动场详解

2025-06 · 14 分钟 · 6785 字

解开 Shampoo:为什么校正特征值 —— 而不总是特征基 —— 能修复它的启发式策略

2025-06 · 11 分钟 · 5261 字

让表格会说话:ConTextTab 如何将语义引入表格内上下文学习

2025-06 · 17 分钟 · 8176 字

Comba — 对双线性 RNN 闭环控制以实现快速且节省内存的序列建模

2025-06 · 17 分钟 · 8421 字

AsymGS — 双模型、更优 3D:使 3D Gaussian Splatting 对野外照片更稳健

2025-06 · 15 分钟 · 7229 字

驱赶百万高斯:最优传输如何在不破坏场景的情况下压缩 3D 高斯渲染

2025-06 · 15 分钟 · 7459 字

Uni-LoRA — 一个向量如何重构整个 LLM 的 LoRA

2025-06 · 21 分钟 · 10291 字

当视觉与运动共进化:SViMo 如何生成一致的手–物交互视频与 3D 运动

2025-06 · 10 分钟 · 4718 字

战胜长远博弈:如何通过缩短视窗解锁可扩展的离线强化学习

2025-06 · 11 分钟 · 5386 字

对冲胜者诅咒:防止推理时的奖励劫持

2025-06 · 11 分钟 · 5127 字

从标记到意图:ARIA 如何让强化学习适用于开放式语言动作

2025-06 · 10 分钟 · 4645 字

ALINE:一个学习提出聪明问题并即时更新信念的单一 Transformer

2025-06 · 11 分钟 · 5474 字

从嘈杂零件到组装形状 — 校正点流如何通过生成形状学习位姿

2025-06 · 16 分钟 · 7740 字

广泛思考,周密规划:MAoP 与 Travel‑Sim 如何教会 LLM 规划真实旅行

2025-06 · 13 分钟 · 6322 字

TimeWak — 在刻度上打水印:可追踪、鲁棒的合成时间序列水印

2025-06 · 12 分钟 · 5590 字

在每一个尺度“倾听”大脑:CSBrain 如何将跨尺度时空结构引入 EEG 基础模型

2025-06 · 16 分钟 · 7702 字

Transformer 如何通过借用技能来学习外推:长度泛化迁移解析

2025-06 · 14 分钟 · 6543 字

“约简映射”如何平整损失曲面 — 几何、曲率与更快收敛的温和导览

2025-06 · 11 分钟 · 5295 字

C-MICL:让学得的约束真正安全——面向优化的保形保证

2025-06 · 11 分钟 · 5083 字

当人们进步时:保守分类器如何在会改进的个体面前取胜

2025-06 · 12 分钟 · 5693 字

当记忆变得有创造力:基于 ReLU 的能量如何让联想记忆既能记住又能发明

2025-06 · 9 分钟 · 4054 字

即时修正预测:频谱校准与闪电更新如何让时空预测更稳健

2025-06 · 14 分钟 · 6693 字

BumbleBee:如何用一个大脑教会人形机器人跳舞、拳击和行走

2025-06 · 7 分钟 · 3473 字

更多动态,更少伪影:DenseDPO 如何革新 AI 视频生成

2025-06 · 6 分钟 · 2771 字

你能用迷你 Transformer 搭建一个巨型 Transformer 吗?

2025-06 · 7 分钟 · 3019 字

GNN 对链接的表达能力有多强?一个新框架、基准测试和一个出人意料的答案

2025-06 · 6 分钟 · 2902 字

AI 能设计出更好的 AI 吗?深入了解 Genesys——一个能发现新语言模型的 LLM

2025-06 · 10 分钟 · 4758 字

为什么大型 AI 模型在游戏中会失败:不稳定梯度的隐藏世界

2025-06 · 8 分钟 · 3521 字

我們能證明生成式模型不會抄襲嗎?版權保護的新視角

2025-06 · 8 分钟 · 3611 字

如何让 AI 彻底遗忘:蒸馏的力量

2025-06 · 6 分钟 · 2932 字

视频生成速度提升 5 倍:FPSAttention 如何解锁实时视频扩散

2025-06 · 5 分钟 · 2410 字

ReSim:在一个由安全专家与冒险新手构成的世界中训练自动驾驶汽车

2025-06 · 7 分钟 · 3423 字

认识 UMA:在近五亿个结构上训练的通用原子 AI 模型

2025-06 · 7 分钟 · 3141 字

AI 如何学习三维视觉:深入解析结构化提示与合成世界

2025-06 · 6 分钟 · 2898 字

因果推断自动驾驶:深入解析 CausalPFN

2025-06 · 11 分钟 · 5194 字

破解代码:如何在大型语言模型内部发现和引导概念

2025-06 · 8 分钟 · 3984 字

模型拼接:一种训练与理解语言模型的捷径

2025-06 · 7 分钟 · 3226 字

解锁双层优化:“集合光滑性”如何驯服非光滑问题

2025-06 · 7 分钟 · 3300 字

Transformer 能学会因果关系吗?深入解读 Do-PFN

2025-06 · 7 分钟 · 3266 字

ROBIN:借助扩散模型高飞,实现更快、更精确的物理模拟

2025-06 · 7 分钟 · 3073 字

坏数据也能出好模型:理解环境扩散

2025-06 · 7 分钟 · 3439 字

超越SMILES字符串:TRIDENT的三叉戟方法如何革新分子AI

2025-06 · 8 分钟 · 3674 字

超越 BEV:GaussianFusion 如何重塑自动驾驶的传感器融合

2025-06 · 7 分钟 · 3341 字

一个模型,统御万象:跨模型空间的摊销推断

2025-06 · 7 分钟 · 3474 字

驯服毒蛇 —— 随机性如何在机器学习中战胜目标性攻击

2025-06 · 8 分钟 · 3646 字

修正漂移:DNAEdit 如何实现高保真 AI 图像编辑

2025-06 · 6 分钟 · 2851 字

“分而治之”为何在多智能体 AI 中有效?秘密在于马尔可夫纠缠

2025-06 · 9 分钟 · 4111 字

训练稳定机器人:祖波夫定理如何解锁巨大的吸引域

2025-06 · 7 分钟 · 3392 字

当平坦性失效:解析高维空间中的神经破碎现象

2025-06 · 8 分钟 · 3815 字

超越平均值:在强化学习中评估回报分布的原则化指南

2025-06 · 7 分钟 · 3150 字

Mamba 与 ViT 的结合:折线路径掩码注意力的威力

2025-06 · 7 分钟 · 3082 字

从压缩到清晰:零样本去噪的突破

2025-06 · 7 分钟 · 3292 字

更聪明,而非更费力:无问题微调如何教会大语言模型自适应思考

2025-06 · 4 分钟 · 1578 字

UniSite:以更智能的方式发现结合口袋,革新药物研发

2025-06 · 7 分钟 · 3431 字

SignViP:一种用于生成超逼真手语视频的全新令牌语言

2025-06 · 6 分钟 · 2949 字

为什么你的谱 GNN 可能是盲目的——以及如何修复它

2025-06 · 7 分钟 · 3268 字

随 STARFlow 而动:归一化流会是图像生成的下一个爆点吗?

2025-06 · 7 分钟 · 3183 字

超越单一答案:ProtInvTree 如何利用智能搜索设计更好的蛋白质

2025-06 · 6 分钟 · 2994 字

Hour-LLaVA:教AI“刷剧”并理解长达一小时的视频

2025-06 · 7 分钟 · 3222 字

没有似然?没问题!用 Fisher 得分匹配直接估计梯度

2025-06 · 7 分钟 · 3361 字

利用自由解压缩窥探“不可触及”矩阵的内部

2025-06 · 8 分钟 · 3606 字

UniRelight:深入解析利用扩散模型联合分解与重现视频光照

2025-06 · 7 分钟 · 3209 字

接近未必够好——近似概率建模中的隐藏难题

2025-06 · 7 分钟 · 3198 字

AI 能在三维空间中观察和聆听吗?介绍 SAVVY,一种空间推理新方法

2025-06 · 7 分钟 · 3377 字

梯度的回响:通过打破时间反演对称性训练序列模型

2025-06 · 11 分钟 · 5020 字

另辟蹊径:状态熵如何让强化学习智能体更鲁棒

2025-06 · 7 分钟 · 3219 字

超越无记忆采样:深入解析伴随薛定谔桥采样器

2025-06 · 7 分钟 · 3120 字

MokA:为多模态世界重新思考 LoRA

2025-06 · 7 分钟 · 3007 字

揭穿噪声神话:生成式 AI 泛化学习的真正原理

2025-06 · 8 分钟 · 3937 字

GP-UCB 宝刀未老:为何这个经典的贝叶斯优化算法是近乎最优的

2025-06 · 6 分钟 · 2899 字

少即是多:自压缩网络如何学会忽略冗余层

2025-06 · 6 分钟 · 2803 字

超越像素:教 AI 像医生一样跨 X 射线、心电图和临床文本进行推理

2025-06 · 9 分钟 · 4215 字

超越每日平均:FuXi-Ocean 如何实现每六小时一次的海洋预报

2025-06 · 7 分钟 · 3269 字

统一物理与复杂性:统计学中计算难度的新视角

2025-06 · 8 分钟 · 3905 字

为什么你的 LLM“确定性”输出并非如此——以及如何解决

2025-06 · 8 分钟 · 3662 字

你能唯一地辨识一个神经网络吗?深入探索多项式网络

2025-06 · 7 分钟 · 3404 字

揭开 Transformer 损失景观的秘密

2025-06 · 7 分钟 · 3381 字

PlayerOne:将单张照片变为可交互的自我中心世界

2025-06 · 7 分钟 · 3201 字

架构手术:‘嫁接’技术如何让我们无需从零重训练即可重塑 AI 模型

2025-06 · 8 分钟 · 3552 字

解码黑箱:借助 EvoLM 深度剖析语言模型训练动态

2025-06 · 6 分钟 · 2802 字

为语言模型做 Boosting?别急:为什么组合生成器可能毁掉一切

2025-06 · 8 分钟 · 3681 字

VoxDet:将分割转化为检测,为 3D 场景理解带来“免费午餐”

2025-06 · 7 分钟 · 3084 字

随 STARFlow 而动:归一化流如何在图像生成领域摘星揽月

2025-06 · 2 分钟 · 844 字

重新思考排练:持续学习中何时序列式优于并发式

2025-06 · 9 分钟 · 4054 字

永不止步的学习——深入探索持续强化学习

2025-06 · 9 分钟 · 4495 字

基础模型困于往昔——持续学习能否使其与时俱进?

2025-06 · 7 分钟 · 3202 字

AI 研究助理到底有多强?深入了解 DeepResearch Bench 基准测试

2025-06 · 7 分钟 · 3179 字

教大语言模型如何自我教学:深入解读自适应语言模型(SEAL)

2025-06 · 7 分钟 · 3059 字

超越 Transformer:MesaNet 如何通过实时优化进行上下文学习

2025-06 · 10 分钟 · 4598 字

五月  135

Seeing Surgery in 3D: How OphNet-3D Reconstructs Hands and Tools for Microsurgical Analysis

2025-05 · 16 分钟 · 7844 字

FlashMD — 用长步幅推动分子动力学向前发展

2025-05 · 18 分钟 · 8596 字

从许多小程序构建世界模型:PoE‑World 如何在少量数据下学习预测与规划

2025-05 · 17 分钟 · 8224 字

教通用视觉-语言模型识别手写数学:深入 Uni‑MuMER

2025-05 · 12 分钟 · 5921 字

把跟踪器变成教师:SANSA 如何揭示 SAM2 内部的语义

2025-05 · 15 分钟 · 7402 字

UniVF 与 VF-Bench — 将时序一致性引入视频融合

2025-05 · 13 分钟 · 6323 字

R-AutoEval+:如何信任(并节省数据用于)像 LLM 裁判一样的自动评估器

2025-05 · 12 分钟 · 5916 字

Absolute Zero:教会语言模型学习——在没有任何数据的情况下

2025-05 · 17 分钟 · 8304 字

视觉-语言模型为何在空间任务上绊倒 —— 从认知视角看 VLM 失败(及简单修复)

2025-05 · 16 分钟 · 7581 字

从两种角度看世界:如何将自视和外视结合让视觉-语言模型更聪明

2025-05 · 16 分钟 · 7854 字

保持质量:用于强度守恒生成模型的离散空间扩散

2025-05 · 15 分钟 · 7395 字

将图像提升到球面:来自腕部相机的 SO(3)-等变视觉运动策略

2025-05 · 17 分钟 · 8293 字

当机器做科学:深入 AI-Researcher —— 端到端自主研究者

2025-05 · 13 分钟 · 6204 字

为什么随机积分器的选择决定深度 BSDE 求解器的成败

2025-05 · 13 分钟 · 6035 字

把模糊变成标尺:如何用散焦 + 预训练扩散先验零样本恢复度量深度

2025-05 · 15 分钟 · 7041 字

QHFLOW — 使用等变流匹配学习具对称性的 DFT 哈密顿量分布

2025-05 · 14 分钟 · 6758 字

如何欺骗 LLM 裁判:通过强化学习逆向工程人类偏好

2025-05 · 16 分钟 · 7516 字

为什么巨大学习率有时有效:受控发散、交叉熵与宽度缩放

2025-05 · 9 分钟 · 4436 字

非线性拉普拉斯 — 给 PCA 一个方向性推动以发现更弱信号

2025-05 · 12 分钟 · 5962 字

有用的捷径:选项感知值学习如何修复长时域离线目标强化学习

2025-05 · 10 分钟 · 4827 字

FlashIPA — 让几何感知注意力扩展到数千残基

2025-05 · 16 分钟 · 7665 字

更快迁移、更聪明定价:CM-TDP 如何让新市场向旧市场学习

2025-05 · 12 分钟 · 5551 字

Enigmata:教会 LLM 解谜的实用配方 — 可扩展的逻辑推理训练方案

2025-05 · 11 分钟 · 5021 字

当“更少的语言”更有用:将语言与推理解耦以构建更好的多语言大模型

2025-05 · 15 分钟 · 7193 字

2025-05 · 5 分钟 · 2092 字

可塑性与赋能 —— 信息理论下的主体能动性镜像

2025-05 · 11 分钟 · 5142 字

当模型知道自己正在被测试:探测并引导推理型大模型的“测试意识”

2025-05 · 11 分钟 · 5020 字

在教机器人执行动作时如何保持视觉-语言骨干不被破坏

2025-05 · 17 分钟 · 8103 字

当一个数字不够时:为什么有些决策需要词典序奖励

2025-05 · 10 分钟 · 4814 字

发现隐藏方向:多指标模型的稳健学习与 SQ 下界

2025-05 · 10 分钟 · 4858 字

别等到结尾:用时序一致性训练增量分类器

2025-05 · 8 分钟 · 3873 字

揭开无分类器引导的面纱:均值移动、对比主成分与 CFG 为什么有效

2025-05 · 12 分钟 · 5776 字

2025-05 · 13 分钟 · 6352 字

引导预训练预测器:从贝叶斯视角看提示微调及其局限

2025-05 · 2 分钟 · 562 字

RepoMaster — 教会代理读取、导航并复用 GitHub 仓库

2025-05 · 11 分钟 · 5109 字

CoRL:强化单一模型以精通视觉理解与生成

2025-05 · 12 分钟 · 5828 字

心智融合:InfiFPO 如何让模型通过偏好相互教学

2025-05 · 14 分钟 · 6778 字

如何学习真正鲁棒的半空间:逐步导读

2025-05 · 13 分钟 · 6252 字

教机器人你的洗衣流程:深入解析 DexGarmentLab

2025-05 · 7 分钟 · 3142 字

解锁亚二次方注意力:深入解读 MonarchAttention

2025-05 · 7 分钟 · 3420 字

寻找最佳平衡点:LLM 训练中临界批量大小的新视角

2025-05 · 7 分钟 · 3151 字

“等待”令牌技巧:通过激活控制唤醒语言模型的深层推理能力

2025-05 · 7 分钟 · 3062 字

解锁 2.3 倍速视频 AI:深入解析 Sparse VideoGen2 的语义感知注意力机制

2025-05 · 7 分钟 · 3013 字

超越平均:Best‑of‑K 强化学习如何解锁更难的问题

2025-05 · 7 分钟 · 3107 字

用图结构修复标签偏移:深入解析 GS-B³SE

2025-05 · 7 分钟 · 3082 字

修复视觉 Transformer:寄存器令牌如何清理混乱的特征

2025-05 · 6 分钟 · 2939 字

LoRAShop:您的 AI Photoshop,无需再训练即可组合和编辑概念

2025-05 · 7 分钟 · 3197 字

让小语言模型表现得像大模型:深入解析智能体蒸馏

2025-05 · 2 分钟 · 849 字

超越提示工程:RePS 如何实现对语言模型的精细控制

2025-05 · 7 分钟 · 3220 字

教 AI 探索:LLM 如何让强化学习更智能

2025-05 · 7 分钟 · 3127 字

DiCo:在扩散 Transformer 时代为卷积网络正名

2025-05 · 6 分钟 · 2833 字

重建 vs. 联合嵌入:深入探讨自监督学习领域的重大辩论

2025-05 · 7 分钟 · 3065 字

注意力就是你预测大脑活动所需要的一切

2025-05 · 8 分钟 · 3738 字

核岭回归的鲁棒性如何?深入探讨重尾噪声

2025-05 · 6 分钟 · 2876 字

预算有限的核方法:使用 Nyström 方法驯服协变量偏移

2025-05 · 6 分钟 · 2861 字

发现差异:子模与超模比率问题的统一视角

2025-05 · 8 分钟 · 3525 字

DeLTa:大语言模型如何在不接触你数据的情况下为决策树赋能

2025-05 · 7 分钟 · 3019 字

超越千亿:DeepSeek-V3 如何通过硬件感知设计重新定义大规模 AI

2025-05 · 7 分钟 · 3092 字

赋予 AI 空间感:深入解读 Spatial-MLLM

2025-05 · 7 分钟 · 3064 字

超越从左到右:FUDOKI 与多模态 AI 的未来

2025-05 · 7 分钟 · 3089 字

超越规模:基于梯度的数据多样性如何解锁下一代大语言模型的推理能力

2025-05 · 7 分钟 · 3125 字

FLAME:一步一步教大语言模型开出更安全的“鸡尾酒”处方

2025-05 · 7 分钟 · 3372 字

耳朵 vs. 眼睛:为什么人工智能难以定位声音——以及神经科学如何提供帮助

2025-05 · 8 分钟 · 3611 字

超越单一分数:ARECHO 如何建模复杂的语音质量网络

2025-05 · 9 分钟 · 4400 字

思想链(CoT)为何有效?一项新理论揭示其奥秘

2025-05 · 6 分钟 · 2580 字

PRODVA:一种乐高式的蛋白质功能设计方法

2025-05 · 7 分钟 · 3207 字

信息在传输中丢失:解构大语言模型中的通信瓶颈

2025-05 · 8 分钟 · 3753 字

Transformer Copilot:教大语言模型从自身错误中学习

2025-05 · 9 分钟 · 4508 字

更智能,而非更大:B3 如何通过智能批次构建革新对比学习

2025-05 · 7 分钟 · 3232 字

克隆巨头:低秩克隆如何让小型语言模型的训练速度提升 1000 倍

2025-05 · 6 分钟 · 3002 字

超越4K:GeoLLaVA-8K如何教AI以超高清分辨率从太空看地球

2025-05 · 7 分钟 · 3489 字

告别步数统计:让“达到目标时间”可微,实现更快优化

2025-05 · 7 分钟 · 3234 字

超越最坏情况:离散分布的实例最优私有估计

2025-05 · 9 分钟 · 4442 字

教 AI 编写 DNA:约束强化学习如何设计细胞类型特异性基因开关

2025-05 · 7 分钟 · 3144 字

SageAttention3:利用 FP4 实现 5 倍速注意力,并深入探讨 8 位训练

2025-05 · 7 分钟 · 3017 字

LODGE:用智能高斯泼溅技术将宏大的 3D 世界带到你的手机上

2025-05 · 7 分钟 · 3112 字

为何有些 AI 模型能够扩展?深入探讨尺寸泛化理论

2025-05 · 10 分钟 · 5004 字

超越状态空间模型:结构化线性受控微分方程 (SLiCEs) 如何兼具速度与表达能力

2025-05 · 7 分钟 · 3449 字

引导 AI 畅游互联网:深入解析 WEB-SHEPHERD

2025-05 · 4 分钟 · 1846 字

快赢或慢输:为什么你的 LLM 智能体需要快速思考

2025-05 · 6 分钟 · 2853 字

惊人的协同效应:为什么稀疏MoE模型偏爱推测解码

2025-05 · 7 分钟 · 3342 字

一条适用于机器学习泛化的热力学定律

2025-05 · 8 分钟 · 3620 字

AirRep:在 AI 数据归因中弥合速度与准确性之间的鸿沟

2025-05 · 6 分钟 · 2957 字

驯服噪声猛兽:迭代式过滤如何征服受污染的数据集

2025-05 · 7 分钟 · 3382 字

超越“多少”:用扩散模型揭示神经元编码的内容

2025-05 · 8 分钟 · 3625 字

揭秘 CEI:深入理解其收敛速率

2025-05 · 7 分钟 · 3111 字

超越简单的谷歌搜索:DeepDiver 如何教 LLM 成为专家级研究员

2025-05 · 7 分钟 · 3398 字

多亏了隐藏的偏见,AI 伪造图像检测技术迎来重大升级

2025-05 · 6 分钟 · 2716 字

拼接未来:扩散模型如何解决强化学习中的一个关键挑战

2025-05 · 7 分钟 · 3450 字

打破权衡:兼具快速学习保证的平滑凸损失函数

2025-05 · 7 分钟 · 3344 字

OmniSync:借助扩散 Transformer,为任意视频开启唇形同步新纪元

2025-05 · 6 分钟 · 2949 字

蝙蝠侠也需要罗宾:小小的“AI搭档”如何增强你巨型模型的置信度

2025-05 · 7 分钟 · 3130 字

超越瓶颈:GraLoRA 如何解锁更高秩的微调

2025-05 · 7 分钟 · 3063 字

当数据说谎时:理解 COMPFLOW——在多变世界中训练强化学习的更智能方法

2025-05 · 7 分钟 · 3124 字

条条大路通罗马:利用多样性感知的强化学习提升大语言模型的数学能力

2025-05 · 7 分钟 · 3033 字

D.Va:让机器人学会“看见”与“行动”的捷径——训练时间从数周缩短至数小时

2025-05 · 8 分钟 · 3659 字

SpecEdge:结合云服务器与边缘 GPU,大幅削减 LLM 成本

2025-05 · 7 分钟 · 3043 字

为 AI 临床医生设置“护栏”:深入探讨医疗保健中的安全强化学习

2025-05 · 7 分钟 · 3386 字

超越多数投票:深入解析 CaMVo,打造高性价比的 LLM 标注方案

2025-05 · 7 分钟 · 3226 字

AuroRA:以 8 倍更少的参数实现 LoRA 的 SOTA 性能

2025-05 · 6 分钟 · 2821 字

UMoE:打造更智能、稀疏激活 Transformer 的统一方案

2025-05 · 6 分钟 · 2989 字

InForage:让大语言模型像人类一样搜寻信息

2025-05 · 7 分钟 · 3238 字

超越网格:CALM-PDE 如何利用自适应卷积求解复杂物理问题

2025-05 · 7 分钟 · 3296 字

强化学习能教会大语言模型像医生一样思考吗?深入解析 DRG‑SAPPHIRE

2025-05 · 7 分钟 · 3269 字

该看哪里:PhySense 如何教会 AI 为物理传感器找到最佳位置

2025-05 · 7 分钟 · 3107 字

MeanFlow:单步生成高保真图像

2025-05 · 6 分钟 · 2645 字

解构经验回放:数据归因如何让强化学习更具可解释性和效率

2025-05 · 7 分钟 · 3258 字

超越扁平视频:Dynam3D 如何赋予导航 AI 真正的 3D 空间感

2025-05 · 7 分钟 · 3069 字

破解触觉密码:AI 模型如何学习像啮齿动物一样“感知”

2025-05 · 8 分钟 · 3568 字

智能的几何学:叠加态如何解释大语言模型为何越大越好

2025-05 · 6 分钟 · 2999 字

破解涌现之谜:稀疏注意力与数据重复如何塑造大语言模型的学习

2025-05 · 7 分钟 · 3483 字

超越负载均衡:构建更智能混合专家模型的新方案

2025-05 · 7 分钟 · 3079 字

一次训练,随处运行:深入解析通用车辆轨迹学习模型 TransferTraj

2025-05 · 7 分钟 · 3337 字

超越准确性:一种用于校准高维预测的通用算法

2025-05 · 7 分钟 · 3361 字

陷入瓶颈?几秒钟的“思考”如何彻底改变你的强化学习智能体性能

2025-05 · 6 分钟 · 2663 字

从刚性规则到灵活学习:一种更智能的等变网络训练方法

2025-05 · 6 分钟 · 3005 字

解压 KVzip:如何在不丢失上下文的情况下让大语言模型更快、更轻

2025-05 · 7 分钟 · 3220 字

Adam 的成功秘诀是什么?深入剖析优化器之王

2025-05 · 7 分钟 · 3337 字

通往更智能 LLM 的大门:一个简单技巧如何增强注意力并消除沉溺现象

2025-05 · 6 分钟 · 2808 字

OpenHOI:通过对话,教会AI与任何物体交互

2025-05 · 7 分钟 · 3072 字

OmniSync:开启任意视频(真实或 AI 生成)唇形同步的新纪元

2025-05 · 9 分钟 · 4019 字

LLM 真的智能吗?KORGym 用 50 多款游戏检验其推理能力

2025-05 · 7 分钟 · 3237 字

一次修复一个面:深入解析 Mesh-RFT

2025-05 · 7 分钟 · 3100 字

一个算法统领全局?图与集合优化的统一视角

2025-05 · 8 分钟 · 3872 字

两全其美:知识绝缘如何让机器人更快、更智能

2025-05 · 6 分钟 · 2905 字

BIOREASON:融合 DNA 和语言模型,教 AI 像生物学家一样思考

2025-05 · 7 分钟 · 3432 字

超越静态帧:深入解析 UniVF 实现无闪烁视频融合

2025-05 · 7 分钟 · 3151 字

当场抓获:我们能通过观察 AI 的“思维过程”来识破其欺骗行为吗?

2025-05 · 8 分钟 · 3528 字

解决AI的“失忆症”:超网络与原型如何战胜灾难性遗忘

2025-05 · 6 分钟 · 2865 字

永不遗忘:让 AI 持续学习的可扩展技巧

2025-05 · 7 分钟 · 3081 字

少即是多:通过增强大语言模型的自信来解锁其推理能力

2025-05 · 6 分钟 · 2828 字

循序渐进学逻辑:课程溯因学习如何稳定AI推理

2025-05 · 7 分钟 · 3377 字

Prism:通过更智能的 GPU 共享,大幅削减 LLM 服务成本

2025-05 · 8 分钟 · 3528 字

即时训练:LLM 如何在测试中持续自我提升

2025-05 · 7 分钟 · 3057 字

LaCT:为什么对于测试时训练和长上下文AI,越大越好

2025-05 · 8 分钟 · 3671 字

四月  28

不教答案也能教会推理:EMPO 如何在无监督下让 LLM 进行推理

2025-04 · 12 分钟 · 5697 字

ReDi:教会扩散模型用特征思考 —— 更快、更智能的图像生成

2025-04 · 11 分钟 · 5243 字

GraphMaster:协调 LLM 代理以合成带文本属性的图

2025-04 · 4 分钟 · 1794 字

可疑的机器人:《Among Us》如何揭示 AI 的欺骗行为

2025-04 · 7 分钟 · 3504 字

Taccel:一款 GPU 加速模拟器,可同时为数千个虚拟机器人带来逼真的触感

2025-04 · 7 分钟 · 3141 字

少即是多:MCTS 引导的数据筛选,解锁视觉语言模型的 SoTA 性能

2025-04 · 7 分钟 · 3207 字

治愈 AI 的“过度思考”:FAST-GRPO 如何教视觉模型快思慢想

2025-04 · 7 分钟 · 3017 字

FramePack:斯坦福与麻省理工学院如何解决 AI 视频生成中的遗忘与漂移问题

2025-04 · 7 分钟 · 3133 字

超越反向传播:去相关误差如何训练神经网络

2025-04 · 8 分钟 · 3842 字

从混沌到相干:扩散模型如何学会绘画

2025-04 · 7 分钟 · 3476 字

揭秘缩放定律:大语言模型如何通过压缩语言进行学习

2025-04 · 10 分钟 · 4567 字

教扩散模型学会推理:深入解读 d1 框架

2025-04 · 3 分钟 · 1454 字

超越复制粘贴:MIGGPT 如何教会大语言模型迁移复杂的内核补丁

2025-04 · 7 分钟 · 3384 字

超越黑盒:PerceptionLM 如何让 AI 视觉研究开放且可复现

2025-04 · 8 分钟 · 3829 字

教会 AI 进行双重检查:VL-Rethinker 如何利用强化学习提升多模态推理能力

2025-04 · 7 分钟 · 3261 字

杂乱数据的惊人优势:深入探究多模态错位

2025-04 · 8 分钟 · 3768 字

寻找万能钥匙:微小子网络如何驱动语言模型预测

2025-04 · 7 分钟 · 3128 字

超越 Softmax:量子电路如何稳定并增强 Transformer 注意力机制

2025-04 · 7 分钟 · 3331 字

解锁隐藏层:感知编码器如何重新定义视觉技术新境界

2025-04 · 11 分钟 · 5393 字

为混乱的离线强化学习理清头绪

2025-04 · 8 分钟 · 3519 字

强化学习让大语言模型更好,但不更聪明:探索人工智能自我提升的极限

2025-04 · 7 分钟 · 3181 字

超越黑盒:PerceptionLM 如何为视觉 AI 构建透明的未来

2025-04 · 9 分钟 · 4089 字

FM-LoRA:让 AI 终身学习而不遗忘

2025-04 · 6 分钟 · 2945 字

即时学习:深入解析神经场的元持续学习

2025-04 · 6 分钟 · 2865 字

超越上下文窗口:MemO 如何赋予 AI 持久记忆

2025-04 · 6 分钟 · 2705 字

BitNet b1.58:重新定义 AI 效率的 1 比特大语言模型

2025-04 · 7 分钟 · 3277 字

Agent S2:AI 专家团队如何掌控你的电脑

2025-04 · 6 分钟 · 2630 字

CoProSketch: 终于有了可以编辑的AI草图生成器

2025-04 · 5 分钟 · 2405 字

三月  29

DeCaFlow — 使用因果正规化流去混淆:一个模型回答多种因果问题

2025-03 · 10 分钟 · 4748 字

从 (ε, δ) 到 ε:随机后处理如何净化差分隐私

2025-03 · 14 分钟 · 6896 字

Opt-CWM:学会向视频预测器提出更好的问题以提取运动

2025-03 · 11 分钟 · 5137 字

2025-03 · 10 分钟 · 4974 字

三方拉锯战:掌握神经压缩中的码率、失真与感知

2025-03 · 6 分钟 · 2981 字

过度思考的 AI:当“思考”损害模型性能时

2025-03 · 9 分钟 · 4290 字

LLM 的平行世界:探索 FFN 融合与模型效率的未来

2025-03 · 6 分钟 · 2962 字

DiLoCo 的扩展秘密:在无通信瓶颈下训练超大规模语言模型

2025-03 · 7 分钟 · 3298 字

自教式前瞻:LLM 如何在无奖励的情况下更聪明地规划

2025-03 · 7 分钟 · 3507 字

CompDiffuser:通过拼接短期技能教机器人进行长期规划

2025-03 · 7 分钟 · 3134 字

打破对称性,优化化学:深入解析 ELECTRA

2025-03 · 7 分钟 · 3429 字

超越对角:不动点迭代如何解锁稠密 RNN

2025-03 · 8 分钟 · 3571 字

这个 AI 会推理吗?理解神经符号学习的新理论

2025-03 · 7 分钟 · 3244 字

超越评分:Q-Insight 如何教 AI 像摄影师一样“看”

2025-03 · 6 分钟 · 2618 字

更智能,而非更费力:自截断技术如何让大语言模型推理效率提升80%

2025-03 · 8 分钟 · 3774 字

UFO 是真的:语言模型如何学会观察、检测和分割我们的世界

2025-03 · 7 分钟 · 3368 字

超越精美画面:WISA 如何教 AI 学习物理定律

2025-03 · 7 分钟 · 3040 字

Q-FAT:一种无需量化的 Transformer,实现更平滑、更智能的机器人模仿学习

2025-03 · 6 分钟 · 2761 字

扩展强化学习:深度如何释放涌现行为

2025-03 · 7 分钟 · 3042 字

Pan-LUT:利用可学习查找表实现闪电般快速的卫星图像锐化

2025-03 · 6 分钟 · 2752 字

超越对角 RNN:不动点迭代如何释放新的表达能力

2025-03 · 6 分钟 · 2994 字

超越CNN:利用Pan-LUT实现闪电般快速的卫星图像融合

2025-03 · 6 分钟 · 2916 字

聚焦无解之境:如何在联邦学习中实现完美收敛

2025-03 · 7 分钟 · 3251 字

低成本对抗 AI 遗忘症:Replay4NCL 如何实现高效终身学习

2025-03 · 7 分钟 · 3233 字

“顿悟”时刻:揭开大型语言模型(LLM)神秘的涌现能力

2025-03 · 8 分钟 · 3946 字

破解密码:神经网络如何将可解释特征藏于显眼之处

2025-03 · 7 分钟 · 3337 字

DAPO:揭秘强化学习,打造超人级大语言模型推理能力

2025-03 · 6 分钟 · 2983 字

弥合差距:RISE 如何应对基于模拟的推断中的缺失数据

2025-03 · 7 分钟 · 3043 字

按需生成 AI 大脑:ORAL 如何为不断演进的 LLM 打造 LoRA 适配器

2025-03 · 6 分钟 · 2930 字

二月  52

平衡过去:如何用差异理论压缩长上下文 Transformer 的 KV 缓存

2025-02 · 13 分钟 · 6461 字

AutoToM:让模型去构建模型 —— 可扩展的自动贝叶斯心智理论

2025-02 · 14 分钟 · 6952 字

培育更安全的智能体:AgentBreeder 如何演化多智能体脚手架以提升能力与安全性

2025-02 · 13 分钟 · 6464 字

教机器人重要的方向:语义方向与 SOFAR 系统

2025-02 · 16 分钟 · 7698 字

边玩边学:乐观镜像下降如何让大语言模型更符合人类偏好

2025-02 · 14 分钟 · 6637 字

当标签在说谎 —— SCAM 如何用自监督重新训练时间序列预测

2025-02 · 15 分钟 · 7400 字

KARMA:多智能体大型语言模型如何将科学论文转化为知识图谱

2025-02 · 14 分钟 · 6763 字

DICEPTION — 将文本到图像扩散模型转变为一个覆盖多种感知任务的单一模型

2025-02 · 21 分钟 · 10104 字

从仓库到运行:Repo2Run 如何用 LLM 代理自动化 Docker 环境

2025-02 · 10 分钟 · 4529 字

UniTok — 如何打造一个既能“看”又能“创”的视觉分词器

2025-02 · 12 分钟 · 5830 字

在大规模下驯服异质性:用于弱耦合 MDP 的基于投影的 Lyapunov 方法

2025-02 · 11 分钟 · 5217 字

为什么你的优化器会选择一个间隔:谱下降、Muon 与多类线性分类器的几何学

2025-02 · 11 分钟 · 5422 字

像人一样阅读:VIST 如何教大语言模型略读长文本

2025-02 · 7 分钟 · 3083 字

超越同量测度:一种可扩展的图上非均衡数据比较新方法

2025-02 · 6 分钟 · 2872 字

Twilight:以自适应稀疏性突破大语言模型推理的固定预算限制

2025-02 · 7 分钟 · 3079 字

一个模型即可统领一切:RobustMerge 如何融合专业化 AI 大脑

2025-02 · 7 分钟 · 3154 字

不只是画得好看:在稳定扩散模型中实施硬约束

2025-02 · 7 分钟 · 3399 字

角度校准:一种可被证明最优的高维分类器校准方法

2025-02 · 7 分钟 · 3301 字

在潜在空间中思考:循环式 LLM 如何学会深度推理

2025-02 · 7 分钟 · 3302 字

超越二次复杂度:解析 MoBA,实现超高效长上下文大语言模型

2025-02 · 6 分钟 · 2927 字

少即是多:用智能数据选择加速 LLM 对齐

2025-02 · 6 分钟 · 2898 字

两全其美:一种用于隐私机器学习的新采样方法

2025-02 · 6 分钟 · 2976 字

超越欧几里得空间:生成式 AI 如何通过李群扩散学习对称性

2025-02 · 6 分钟 · 2796 字

超越平均值:复杂金融与科学模型的量子飞跃

2025-02 · 7 分钟 · 3229 字

BevSplat:用 3D 高斯“绘画”从太空精准定位你的位置

2025-02 · 7 分钟 · 3172 字

KL 校准:通往可靠在线预测的更强路径

2025-02 · 6 分钟 · 2917 字

GSRF:溅射无线电波,实现超快速无线仿真

2025-02 · 7 分钟 · 3082 字

超越稳定性边缘:为何任意步长都适用于梯度下降

2025-02 · 8 分钟 · 3698 字

核周采样(Perinucleus Sampling):在不损害模型的前提下向 LLM 嵌入超过 24,000 个指纹

2025-02 · 7 分钟 · 3286 字

超越直觉:双心智 AI 如何学习用逻辑预测未来

2025-02 · 7 分钟 · 3021 字

对称博弈与最小最大优化中隐藏的复杂性

2025-02 · 7 分钟 · 3291 字

如何利用反事实解释窃取 AI 模型

2025-02 · 7 分钟 · 3117 字

微调不可知学习:深入探究近乎最优的分类

2025-02 · 8 分钟 · 3515 字

GRAPE:通过寻找最匹配的数据,从大语言模型中榨取更多性能

2025-02 · 6 分钟 · 2621 字

征服魔方:人工智能如何打破巨型 5×5×5 魔方谜题的记录

2025-02 · 7 分钟 · 3227 字

标签平滑的隐藏缺陷——MaxSup 来修复

2025-02 · 6 分钟 · 2784 字

为什么模拟 AI 训练会出错:理解并修复非理想阻性器件

2025-02 · 8 分钟 · 3824 字

超越下一个词元预测:挑战大语言模型范式的扩散模型 LLaDA

2025-02 · 6 分钟 · 2968 字

神经网络训练的三个时代:学习、过拟合与遗忘

2025-02 · 9 分钟 · 4435 字

找到正确的角度:一种在高维空间中实现完美校准模型的新方法

2025-02 · 7 分钟 · 3370 字

一个 LoRA 能否统领全局?C-LoRA 终身学习方法介绍

2025-02 · 6 分钟 · 2963 字

超越记忆:Minnow 如何让语言模型即时掌握新词

2025-02 · 9 分钟 · 4493 字

AnyMDP 与 OmniRL:构建能在随机世界中即时学习的 AI 智能体

2025-02 · 7 分钟 · 3336 字

Optimus-2:让 AI 像专家一样玩转 Minecraft 的更智能策略

2025-02 · 7 分钟 · 3319 字

IndexTTS:深入解读 Bilibili 的工业级可控声音克隆系统

2025-02 · 7 分钟 · 3100 字

让大语言模型真正遗忘:更平滑的路径如何化解“失忆恢复”攻击

2025-02 · 7 分钟 · 3369 字

数据策展的艺术:深入探索最先进的小型语言模型 SmolLM2

2025-02 · 8 分钟 · 3774 字

为什么你的可解释 AI 可能在欺骗你:深入剖析联合推理捷径

2025-02 · 8 分钟 · 3659 字

超越 AdamW:Muon 优化器如何让大语言模型训练速度提升两倍

2025-02 · 7 分钟 · 3224 字

别再重复犯错:LLM 如何实时从反馈中学习

2025-02 · 6 分钟 · 2885 字

超越训练循环:用推理时技巧解锁 LLM 的推理能力

2025-02 · 6 分钟 · 2994 字

YOLOv12: 打破CNN垄断的注意力机制实时检测器

2025-02 · 6 分钟 · 2699 字

一月  15

超越记忆:DeepSeek-R1 如何教会大语言模型真正地推理

2025-01 · 7 分钟 · 3058 字

2025-01 · 14 分钟 · 6912 字

Wigner 6j 重新耦合如何让等变 Transformer 可扩展:友好的 E2Former 深入解析

2025-01 · 13 分钟 · 6502 字

谨慎花费:为什么你的合成数据集应呈指数增长

2025-01 · 11 分钟 · 5093 字

数据的双螺旋:联合学习样本与特征的层次结构

2025-01 · 9 分钟 · 4394 字

超越高斯过程:用算子流匹配学习任意函数分布

2025-01 · 7 分钟 · 3129 字

脉冲、位置与 Transformer——类脑人工智能中的相对编码新思路

2025-01 · 7 分钟 · 3371 字

超越点积:用张量积注意力压缩大语言模型的内存

2025-01 · 8 分钟 · 3666 字

解读 VITA-1.5:开源社区对实时 AI 视觉与语音的探索

2025-01 · 6 分钟 · 2950 字

SD-LoRA:基础模型如何实现无遗忘的持续学习

2025-01 · 7 分钟 · 3058 字

遇见 Titans:一种能在运行时学习记忆的新型 AI

2025-01 · 7 分钟 · 3383 字

超越金鱼记忆:Zep 的时序知识图谱如何赋予 AI 更智能的大脑

2025-01 · 7 分钟 · 3463 字

为什么你的猫仍然比最先进的人工智能更聪明

2025-01 · 7 分钟 · 3432 字

超越黑箱:深入探索自可解释神经网络

2025-01 · 11 分钟 · 5256 字

超越预训练:大语言模型如何即时重构其‘大脑’

2025-01 · 7 分钟 · 3237 字

2024  120

十二月  12

Mulberry 与 CoMCTS —— 教会多模态大模型协同思考、智能搜索与反思

2024-12 · 16 分钟 · 7736 字

教会 2D 模型理解 3D:一种全新的分子交互预训练策略

2024-12 · 8 分钟 · 3640 字

AlphaZero、齐夫定律与惊人的频率力量

2024-12 · 7 分钟 · 3435 字

驯服蜂群——子采样如何解锁可扩展的多智能体 AI

2024-12 · 10 分钟 · 4635 字

预测未来:TREND 如何让自动驾驶汽车实现四维感知

2024-12 · 6 分钟 · 2837 字

当算法变得不稳定:深入解析 UCB-V 老虎机算法

2024-12 · 7 分钟 · 3068 字

S2P2:重新定义事件序列预测的深度状态空间模型

2024-12 · 7 分钟 · 3311 字

超越固定架构:AI 模型如何通过成长实现终身学习

2024-12 · 7 分钟 · 3304 字

超越小样本:解构语境学习的全貌

2024-12 · 8 分钟 · 3550 字

AI、大脑模型与混乱数据:构建鲁棒的摊销贝叶斯推断

2024-12 · 8 分钟 · 3767 字

TRELLIS:用统一的隐空间结构编织高质量 3D 世界

2024-12 · 6 分钟 · 2530 字

从未见过画作的AI,如何学会艺术创作?

2024-12 · 6 分钟 · 2915 字

十一月  12

当模态竞争:博弈论与互信息如何拯救多模态学习

2024-11 · 11 分钟 · 5397 字

EigenPro 4:用于快速大规模核学习的延迟投影

2024-11 · 13 分钟 · 6321 字

深入机器之心:揭示 LLM 中的推理电路

2024-11 · 7 分钟 · 3189 字

教神经网络思考:潜在程序搜索的力量

2024-11 · 7 分钟 · 3048 字

超越 MAML:一种利用核与梯度协调的更快、更智能的学会学习之道

2024-11 · 7 分钟 · 3086 字

即时学习:深入解析用于持续学习的 Online-LoRA

2024-11 · 8 分钟 · 3509 字

DualLoRA:教视觉 Transformer 新技巧,同时不忘旧知识

2024-11 · 6 分钟 · 2916 字

当模型遇见现实:测试时自适应终极指南

2024-11 · 10 分钟 · 4739 字

训练大语言模型成为自己最严厉的批判者

2024-11 · 8 分钟 · 3770 字

超越提示:揭示大型语言模型中的捷径学习

2024-11 · 7 分钟 · 3354 字

A-BLINK:使用神经网络为高斯过程推理提速

2024-11 · 7 分钟 · 3012 字

为什么 AI 不像我们一样“懂”:对齐人类与机器的泛化方式

2024-11 · 7 分钟 · 3338 字

十月  20

超越平面国:为什么双曲几何是 LLM 推理的下一个前沿

2024-10 · 6 分钟 · 2883 字

超越均值:一种性能接近最优的不宁腿老虎机新策略

2024-10 · 8 分钟 · 4006 字

教语言模型开车:PLMTrajRec 如何填补 GPS 数据的空白

2024-10 · 7 分钟 · 3291 字

一个任务,多种解法——神经网络如何揭示智能背后隐藏的多样性

2024-10 · 8 分钟 · 3540 字

SSM 的隐藏漏洞:干净数据如何破坏 Mamba、S4 及其同类模型

2024-10 · 9 分钟 · 4208 字

教 AI 像人一样学习:深入解析对比元学习(ConML)

2024-10 · 7 分钟 · 3313 字

Transformer 是可学习的:一种用于线性注意力的多项式时间算法

2024-10 · 6 分钟 · 2887 字

Transformer 可被证明高效学习——至少某些类型可以

2024-10 · 7 分钟 · 3183 字

翻转难题:当对称性成为障碍时,如何确定 3D 模型的朝向

2024-10 · 6 分钟 · 2854 字

超越‘即训即测’:对比学习如何为元学习器赋能

2024-10 · 6 分钟 · 2882 字

超越回合制:OmniFlatten 如何教 AI 进行自然、可被打断的语音对话

2024-10 · 7 分钟 · 3058 字

AI 能看见显而易见的事物吗?为何顶级视觉模型也会在简单推理上失败

2024-10 · 7 分钟 · 3117 字

揭秘扩散模型加速的秘密:AdaptiveDiffusion 如何智能地跳过步骤

2024-10 · 6 分钟 · 2681 字

驯服两大“对手”:鲁棒稀疏回归的突破性进展

2024-10 · 8 分钟 · 3848 字

用随机数据解锁上下文强化学习——深入解析状态-动作蒸馏(SAD)

2024-10 · 7 分钟 · 3255 字

AlphaGateau:利用图表示,更快、更智能地训练国际象棋引擎

2024-10 · 7 分钟 · 3230 字

LLM 如何自我学习,变得更值得信赖

2024-10 · 6 分钟 · 2915 字

ACE:一个统一视觉、优化和科学模拟的 Transformer 模型

2024-10 · 7 分钟 · 3182 字

FLASHMASK:用超高效注意力掩码驾驭长序列

2024-10 · 6 分钟 · 2637 字

可视化故事写作:通过操作交互式故事地图来编辑叙事

2024-10 · 6 分钟 · 2652 字

九月  7

2024-09 · 14 分钟 · 6636 字

HM3:通过强化学习与多目标优化重塑模型合并

2024-09 · 7 分钟 · 3171 字

寻找公平性前沿:无需训练复杂模型即可计算最优权衡

2024-09 · 6 分钟 · 2883 字

AI 可解释性中的隐藏弱点:当特征相互“吸收”时

2024-09 · 8 分钟 · 3823 字

学会关联:任务相似性如何解决元学习的欠拟合问题

2024-09 · 8 分钟 · 3782 字

叠加之困:一个神经元究竟能计算多少个特征?

2024-09 · 7 分钟 · 3079 字

超越静态模型:TTT-UNet如何即时自适应以实现卓越的医学图像分割

2024-09 · 7 分钟 · 3027 字

八月  2

滤除噪声:深入探究用于小样本学习的特征对齐技术

2024-08 · 6 分钟 · 2663 字

超越存储:解析叠加态计算背后的数学原理

2024-08 · 7 分钟 · 3291 字

七月  12

学会学习:深入探索元学习与表示学习的理论基础

2024-07 · 7 分钟 · 3010 字

训练不可训练的模型:JumpReLU 如何在语言模型中解锁更优特征

2024-07 · 7 分钟 · 3047 字

破解黑箱:Transformer 可解释性机理实用指南

2024-07 · 11 分钟 · 5227 字

永不遗忘:MAGMAX 和模型合并如何革新持续学习

2024-07 · 7 分钟 · 3180 字

C-ADA:一种更快、更智能且不会遗忘的人工智能学习方式

2024-07 · 7 分钟 · 3104 字

超越钻石:ODYSSEY 如何训练 AI 掌握《我的世界》开放世界

2024-07 · 8 分钟 · 3650 字

RNN 回归?让隐藏状态成为学习器,解锁长上下文潜力

2024-07 · 7 分钟 · 3348 字

自我意识悖论:教神经网络自我建模如何使其变得更简单

2024-07 · 7 分钟 · 3050 字

Train-Attention:教会大语言模型在持续学习中关注关键信息

2024-07 · 3 分钟 · 1233 字

Longhorn:将状态空间模型重新构想为在线学习器

2024-07 · 7 分钟 · 3200 字

从 30 分钟到 3 分钟:MInference 如何将百万词元提示的 LLM 等待时间缩短

2024-07 · 5 分钟 · 2328 字

深入解析 FlashAttention-3:异步与 FP8 如何为 Transformer 加速

2024-07 · 6 分钟 · 2698 字

六月  13

MEMENTO: Teaching Neural Solvers to Remember — Faster, Smarter Routing with Memory-Augmented Inference

2024-06 · 15 分钟 · 7267 字

协作式“学习如何学习”——陪练伙伴如何提升元学习效果

2024-06 · 7 分钟 · 3232 字

为神经过程注入强劲动力:上下文内上下文学习如何利用相似数据集

2024-06 · 7 分钟 · 3457 字

为 Transformer 瘦身:通过边剪枝揭示隐藏电路

2024-06 · 3 分钟 · 1361 字

超越神经元:使用 Transcoder 在大语言模型中寻找可解释回路

2024-06 · 7 分钟 · 3377 字

解构大语言模型:深入探究稀疏自编码器的缩放

2024-06 · 7 分钟 · 3048 字

解码黑箱:为何让大语言模型更具可解释性,也可能让它们更智能

2024-06 · 7 分钟 · 3249 字

为什么你的AI会遗忘——以及专家团队如何解决它:深入探讨用于持续学习的混合专家模型

2024-06 · 7 分钟 · 3424 字

对抗 AI 遗忘症:EVCL 如何结合贝叶斯推断与正则化来掌控持续学习

2024-06 · 6 分钟 · 2978 字

超越排行榜天花板:为什么 MMLU-Pro 是测试 LLM 的新黄金标准

2024-06 · 6 分钟 · 2958 字

超越单打独斗:VillagerAgent 如何教 AI 在《我的世界》中团队合作

2024-06 · 7 分钟 · 3426 字

超越思维链:CPO 如何在不降低速度的情况下让大语言模型更智能

2024-06 · 6 分钟 · 3002 字

超越像素:MASt3R 如何让二维图像匹配扎根于三维现实

2024-06 · 6 分钟 · 2923 字

五月  11

超越训练数据:深入解析MetaGS,实现逼真的3D重光照

2024-05 · 8 分钟 · 3514 字

解决 AI 的“健忘症”:深入解析 MGSER-SAM,实现更智能的持续学习

2024-05 · 6 分钟 · 2919 字

CAMeLU:利用上下文学习教 Transformer 从无标签数据中学习

2024-05 · 8 分钟 · 3845 字

驯服混乱:分组多样化 AI 模型如何增强无数据元学习

2024-05 · 6 分钟 · 2920 字

结合贝叶斯与元学习,摆脱灾难性遗忘

2024-05 · 7 分钟 · 3394 字

教 LLM 学习:MAML-en-LLM 如何解锁更强的情境学习能力

2024-05 · 6 分钟 · 2990 字

深入解析YOLOv10:它如何实现端到端的速度与SOTA精度

2024-05 · 7 分钟 · 3078 字

初识 MicroAdam:可证明收敛的内存节省型优化器

2024-05 · 6 分钟 · 2734 字

RNN 的回归?深入解读 xLSTM

2024-05 · 10 分钟 · 4633 字

Mamba‑2 解析:连接状态空间模型与注意力机制的对偶性

2024-05 · 10 分钟 · 4964 字

2024-05 · 6 分钟 · 2964 字

四月  7

永不停学:CLP 算法如何让机器人在真实世界中自适应

2024-04 · 7 分钟 · 3132 字

教大语言模型即学即会:深入解析用于关系抽取的 MICRE

2024-04 · 7 分钟 · 3330 字

解决 AI 的“失忆症”:深入解析基于效用的扰动梯度下降 (UPGD)

2024-04 · 7 分钟 · 3164 字

归纳、演绎、溯因:解构大语言模型的三大推理谜题

2024-04 · 6 分钟 · 2831 字

学习泛化:元学习如何破解域泛化难题

2024-04 · 8 分钟 · 3748 字

一次训练,永续推断:深入探讨摊销神经推断

2024-04 · 10 分钟 · 4968 字

从 2D 像素到 3D 溅射:GS-LRM 如何仅凭几张图像重建世界

2024-04 · 5 分钟 · 2408 字

三月  8

永不止步的 Transformer:深入探讨在线持续学习

2024-03 · 7 分钟 · 3142 字

超越神经元:寻找并修复大语言模型内部的可解释回路

2024-03 · 7 分钟 · 3504 字

一个框架统领全局:统一持续学习并引入‘刷新学习’

2024-03 · 7 分钟 · 3159 字

MATHVERSE:AI 模型真的能看懂数学问题中的图表吗?

2024-03 · 8 分钟 · 3693 字

超越碰撞检测:教会 AI 理解事故发生的原因

2024-03 · 7 分钟 · 3169 字

MVSplat:仅用几张照片,构建令人惊叹的 3D 世界

2024-03 · 5 分钟 · 2446 字

超越 Transformer:VideoMamba 如何解锁高效的长视频理解

2024-03 · 6 分钟 · 2572 字

超越 Transformer:LocalMamba 如何释放状态空间模型在视觉领域的潜力

2024-03 · 5 分钟 · 2445 字

二月  12

将物资送给最需要的人:效用最大化的新视角

2024-02 · 8 分钟 · 3775 字

对抗 AI“失忆症”:深入解析 CORE 的认知回放

2024-02 · 6 分钟 · 2972 字

永不止步:我们如何让大型语言模型保持最新

2024-02 · 7 分钟 · 3371 字

GPT-4 能在《我的世界》中搞建筑吗?大型语言模型作为协作式游戏智能体

2024-02 · 6 分钟 · 2692 字

BitNet b1.58:可能永远改变 AI 的 1 比特大语言模型

2024-02 · 6 分钟 · 2966 字

超越梯度下降:Transformer 如何发现自己的优化算法

2024-02 · 6 分钟 · 2710 字

从零星数据中学习——深入探讨图上少样本学习

2024-02 · 7 分钟 · 3283 字

LLM 如何实现“现学现卖”?深入解析上下文学习

2024-02 · 7 分钟 · 3037 字

耐心的力量:分块更新如何解决延迟老虎机反馈问题

2024-02 · 6 分钟 · 2981 字

超越文本:GITA 如何教 AI 看懂图并进行推理

2024-02 · 6 分钟 · 2736 字

超越晴天:G-NAS 如何让目标检测器在黑暗中也能看清

2024-02 · 5 分钟 · 2462 字

LGM:使用高斯泼溅技术在 5 秒内创建高分辨率 3D 模型

2024-02 · 5 分钟 · 2480 字

一月  4

永不遗忘的 AI 新纪元:预训练模型持续学习指南

2024-01 · 8 分钟 · 3527 字

将3D高斯溅射场景压缩31倍,渲染速度提升4倍

2024-01 · 6 分钟 · 2632 字

Vision Mamba:Transformer 在计算机视觉领域的新挑战者?

2024-01 · 6 分钟 · 2581 字

VMamba:计算机视觉领域 CNN 与 Transformer 的新挑战者

2024-01 · 5 分钟 · 2402 字

2023  78

十二月  6

教神经网络记忆:一种能学习自身学习算法的人工智能

2023-12 · 8 分钟 · 3551 字

从涌现中学习:抑制“记忆型”神经元如何提升 AI 性能

2023-12 · 7 分钟 · 3399 字

AI 如何利用知识图谱学会做出有根据的猜测

2023-12 · 7 分钟 · 3008 字

MP5:如何构建一个会思考、感知和规划的《我的世界》AI

2023-12 · 7 分钟 · 3247 字

超越真实感:Feature 3DGS 为 3D 场景带来 AI 理解能力

2023-12 · 6 分钟 · 2561 字

DUSt3R 如何重新定义三维重建——无需相机信息

2023-12 · 6 分钟 · 2768 字

十一月  10

Meta-Adapter:一种“学会学习”的方法,仅用少量样本即可增强 CLIP

2023-11 · 7 分钟 · 3141 字

对抗 AI 的“胡言乱语”:介绍用于评估视觉幻觉的新基准 AMBER

2023-11 · 6 分钟 · 2878 字

超越浅层对齐:CogVLM 如何让语言模型学会“看见”

2023-11 · 7 分钟 · 3183 字

破解黑盒:深入探究大语言模型如何即时学习

2023-11 · 7 分钟 · 3382 字

解开纠缠之网:元学习、在线学习与持续学习指南

2023-11 · 9 分钟 · 4072 字

提炼公平性:公平 Wasserstein 核集如何应对大数据中的偏见问题

2023-11 · 8 分钟 · 3698 字

LightGaussian:将 3D 场景压缩 15 倍,同时提升渲染速度

2023-11 · 5 分钟 · 2264 字

GaussianShader:为实时渲染带来逼真的反射效果

2023-11 · 6 分钟 · 2649 字

GS-SLAM:高斯溅射开启实时3D建图新纪元

2023-11 · 5 分钟 · 2281 字

Mip-Splatting:三维高斯溅射中实现清晰变焦的秘密

2023-11 · 4 分钟 · 1895 字

十月  6

LSTM 能学会如何学习吗?深入探讨外积 LSTM

2023-10 · 7 分钟 · 3432 字

BitNet:1-bit Transformer 开启大语言模型新纪元

2023-10 · 6 分钟 · 2871 字

ClusT3:利用信息不变聚类适应未知环境

2023-10 · 7 分钟 · 3326 字

超越 Transformer:用 Monarch Mixer 实现深度学习的亚二次方扩展

2023-10 · 8 分钟 · 3941 字

GaussianDreamer:融合2D与3D AI,15分钟从文本生成惊艳3D模型

2023-10 · 6 分钟 · 2716 字

解锁海量上下文:深入解读 DISTFLASHATTN

2023-10 · 5 分钟 · 2385 字

九月  4

超越神经元:用稀疏自动编码器发现语言模型中的真正特征

2023-09 · 7 分钟 · 3083 字

超越实验室:一百万次真实世界对话揭示了 LLM 的什么?

2023-09 · 7 分钟 · 3177 字

AI 能取代人类训练大语言模型吗?深入探讨 RLAIF

2023-09 · 7 分钟 · 3038 字

Promptbreeder:大型语言模型如何自我教学,成为更优秀的问题解决者

2023-09 · 7 分钟 · 3306 字

八月  2

用自然语言解锁数据库:深入探索 DAIL-SQL 与提示工程

2023-08 · 7 分钟 · 3234 字

实时辐射场:深入解析3D高斯溅射技术

2023-08 · 6 分钟 · 2593 字

七月  5

学会学习:深入探索元学习的世界

2023-07 · 8 分钟 · 3576 字

MetaDiff:我们能像训练扩散模型一样训练少样本学习器吗?

2023-07 · 6 分钟 · 3004 字

永不遗忘:随机投影如何帮助 AI 持续学习

2023-07 · 8 分钟 · 3516 字

RLHF 的问题:深入剖析用人类反馈训练 AI 的缺陷

2023-07 · 7 分钟 · 3136 字

FlashAttention-2:为 Transformer 带来更迅捷、更高效的注意力机制

2023-07 · 7 分钟 · 3084 字

六月  11

Wanda:一种同时关注权重激活值的 LLM 剪枝方法

2023-06 · 7 分钟 · 3380 字

超网络:构建其他神经网络的神经网络

2023-06 · 7 分钟 · 3315 字

深度学习的阿喀琉斯之踵:为什么神经网络会忘记如何学习

2023-06 · 7 分钟 · 3426 字

PandaLM 简介:让其他 AI 模型更聪明的 AI 裁判

2023-06 · 6 分钟 · 2869 字

LLM-Blender:融合语言模型精粹,打造更智能的AI

2023-06 · 6 分钟 · 2791 字

视觉语言模型究竟有多强?深入解析 MME 基准测试

2023-06 · 5 分钟 · 2373 字

AI 能评判 AI 吗?深入探讨使用 LLM 进行聊天机器人评估

2023-06 · 7 分钟 · 3374 字

认识 STEVE-1:研究人员如何仅用 60 美元就教会一个 Minecraft 智能体听懂指令

2023-06 · 8 分钟 · 3669 字

我们如何从少量信息中学到如此之多:一个用自然语言思考的贝叶斯模型

2023-06 · 6 分钟 · 2966 字

用…SGD求解巨型高斯过程?深入探究良性非收敛现象

2023-06 · 6 分钟 · 2656 字

超越 FlashAttention:利用动态稀疏性让 Transformer 再提速

2023-06 · 5 分钟 · 2270 字

五月  11

注意力机制的内存“零”开销:深入解析恒定内存注意力神经过程

2023-05 · 8 分钟 · 3570 字

超越少样本学习:LLM 如何教会自己更好地学习

2023-05 · 7 分钟 · 3039 字

追求完美记忆:深入剖析理想的持续学习者

2023-05 · 7 分钟 · 3233 字

强经验回放:对抗灾难性遗忘的新利器

2023-05 · 7 分钟 · 3124 字

更深不一定更好:理解现代神经网络中的“隧道效应”

2023-05 · 6 分钟 · 3004 字

BIRD 已经降临:一个新的基准测试,用于检验 LLM 是否真的能与大数据对话

2023-05 · 7 分钟 · 3309 字

GITM:一个由 LLM 驱动的“幽灵”如何掌控《我的世界》的科技树

2023-05 · 7 分钟 · 3334 字

超越监督学习:用强化学习微调扩散模型

2023-05 · 7 分钟 · 3262 字

深度集成为何有效?新理论将其与贝叶斯方法统一

2023-05 · 6 分钟 · 2689 字

解锁黑箱:大语言模型中思维链背后的理论

2023-05 · 9 分钟 · 4409 字

超越微调:深入探究任务算术与权重解耦

2023-05 · 6 分钟 · 2523 字

四月  5

分割任意对象:为图像分割构建基础模型

2023-04 · 13 分钟 · 6378 字

思维链为何有效:关键在于局部经验

2023-04 · 7 分钟 · 3084 字

逆向工程 AI:深入探索自动化电路发现

2023-04 · 7 分钟 · 3226 字

为什么随机切分是解释聚类的最佳方法

2023-04 · 6 分钟 · 2531 字

从v1到v8及更远:YOLO的完整发展史

2023-04 · 8 分钟 · 3529 字

三月  7

AGI 的火花:深入探讨 GPT-4 惊人的能力

2023-03 · 9 分钟 · 4214 字

学会学习:元学习如何攻克金融AI中的数据稀缺难题

2023-03 · 6 分钟 · 2837 字

学会学习:元学习在小样本场景下的深度指南

2023-03 · 10 分钟 · 4769 字

Reflexion:语言模型如何通过与自己对话来从错误中学习

2023-03 · 7 分钟 · 3254 字

当你的模型遇到真实世界——深入解析测试时自适应

2023-03 · 10 分钟 · 4996 字

超越试错:LLM 智能体如何通过自言自语进行学习

2023-03 · 6 分钟 · 2771 字

Zero-1-to-3:AI如何从单张照片想象出3D物体

2023-03 · 6 分钟 · 2750 字

二月  8

Mnemosyne:学习优化其他神经网络的 Transformer

2023-02 · 7 分钟 · 3091 字

永不止步:AI持续学习深度指南

2023-02 · 12 分钟 · 5744 字

ESMER:一种受大脑启发的解决方案,用于修复神经网络中的灾难性遗忘

2023-02 · 6 分钟 · 2955 字

终身学习背后的数学:深入探究遗忘与泛化

2023-02 · 7 分钟 · 3319 字

Transformer 没了安全网还能走多深?驯服原生模型中的信号传播

2023-02 · 7 分钟 · 3225 字

告别从零开始:用先验数据为强化学习增效的简单秘诀

2023-02 · 7 分钟 · 3285 字

EvoPrompting:如何将语言模型进化为 AI 架构大师

2023-02 · 6 分钟 · 2634 字

TPVFormer:用三视角视图从二维快照重建三维世界

2023-02 · 6 分钟 · 2674 字

一月  3

BLIP-2:如何高效地教会大型语言模型“看见”

2023-01 · 7 分钟 · 3266 字

SparseGPT:如何在无需再训练的情况下从 LLM 中删除 1000 亿参数

2023-01 · 7 分钟 · 3184 字

学习如何学习:深入探索元强化学习

2023-01 · 10 分钟 · 4648 字

2022  25

十二月  3

Whisper:深入探究 OpenAI 对人类级语音识别的追求

2022-12 · 8 分钟 · 3549 字

超越记忆:Transformer 如何元学习通用学习算法

2022-12 · 7 分钟 · 3114 字

Pile 数据集上的饿饿河马:Transformer 王座的新挑战者

2022-12 · 6 分钟 · 2878 字

十一月  2

从薛定谔桥到神经网络:一种新的端到端熵正则化最优传输求解器

2022-11 · 5 分钟 · 2500 字

重新思考神经网络设计:深度剖析梯度路径分析

2022-11 · 6 分钟 · 2603 字

十月  1

NeRF、高斯泼溅及未来:神经辐射场导览

2022-10 · 8 分钟 · 4007 字

九月  4

多模态AI巡礼:塑造未来的六大核心挑战

2022-09 · 12 分钟 · 5649 字

超越重用:教会元学习模型习得新特征

2022-09 · 7 分钟 · 3113 字

当神经元变得拥挤:深入探究叠加现象

2022-09 · 11 分钟 · 5340 字

扩散模型的全景之旅:从基础到前沿

2022-09 · 11 分钟 · 5278 字

八月  1

超越缺口:深入解析 SSSD 在时间序列插补与预测中的应用

2022-08 · 5 分钟 · 2470 字

七月  1

AdaptCL:在不断变化的数据上训练单一 AI 模型且不会遗忘

2022-07 · 7 分钟 · 3380 字

六月  3

寻找更平坦的谷底:Sharp-MAML 如何改进小样本学习

2022-06 · 7 分钟 · 3477 字

为学习而生:打造能够自我适应与演化的人工智能

2022-06 · 7 分钟 · 3269 字

更简单的 S4:对角状态空间模型(S4D)如何以更低复杂度实现同等性能

2022-06 · 6 分钟 · 2778 字

五月  1

FlashAttention:IO 感知是解锁长上下文 Transformer 的关键吗?

2022-05 · 6 分钟 · 2600 字

三月  4

InstructGPT:通过人类反馈教 GPT-3 遵循指令

2022-03 · 9 分钟 · 4119 字

解码 MAML:一种用于超快速神经架构搜索的新核函数

2022-03 · 6 分钟 · 2900 字

超越大数据:深入探索小样本学习

2022-03 · 8 分钟 · 3735 字

为什么AI会遗忘,而我们(通常)不会:来自大脑中“持续学习者”的启示

2022-03 · 7 分钟 · 3490 字

二月  2

学习如何学习:自修改网络如何解锁真正的人工智能适应性

2022-02 · 8 分钟 · 3642 字

SASHIMI:用状态空间模型切分原始音频

2022-02 · 2 分钟 · 780 字

一月  3

大道至简:EASY 如何用简单技巧实现顶尖小样本学习

2022-01 · 7 分钟 · 3373 字

重写过去,预备未来:深入解析持续学习模型 X-DER

2022-01 · 8 分钟 · 3776 字

让每个像素都物尽其用:深入解析高效非局部对比注意力

2022-01 · 5 分钟 · 2473 字

2021  27

十二月  2

向大师学习:深入解析 Ex-Model 持续学习

2021-12 · 7 分钟 · 3280 字

潜在扩散模型如何生成令人惊叹的 AI 艺术(Stable Diffusion 论文详解)

2021-12 · 8 分钟 · 3515 字

十一月  1

教机器描述视频:深入解析 SWINBERT

2021-11 · 5 分钟 · 2437 字

十月  4

SpeechT5:一个模型统领所有语音与文本任务

2021-10 · 4 分钟 · 1685 字

教语言模型即时学习:深入解析上下文调优 (ICT)

2021-10 · 6 分钟 · 2929 字

超越提示工程:MetaICL 如何教会语言模型即时学习

2021-10 · 6 分钟 · 2836 字

序列模型的瑞士军刀:深入探究线性状态空间层

2021-10 · 6 分钟 · 2727 字

九月  1

只需告诉模型做什么:指令精调如何解锁零样本学习能力

2021-09 · 9 分钟 · 4045 字

八月  1

当程序库没有规则:一个数据驱动的侦探故事,揭秘代码规约

2021-08 · 7 分钟 · 3257 字

七月  1

深入 Codex:驱动 GitHub Copilot 的 AI 结对程序员

2021-07 · 6 分钟 · 2529 字

六月  5

超越 Adam:AI 如何学会优化神经网络

2021-06 · 7 分钟 · 3492 字

元学习的进化提速:深入解析 EvoGrad

2021-06 · 7 分钟 · 3279 字

一个模型统治所有?为何持续学习需要一个“模型动物园”

2021-06 · 7 分钟 · 3224 字

Decision Transformer:当语言模型学会玩游戏

2021-06 · 6 分钟 · 2799 字

LoRA:用万分之一的参数,微调超大语言模型

2021-06 · 5 分钟 · 2406 字

五月  1

为什么视觉变换器出人意料地稳健:来自《视觉变换器是稳健的学习者》的洞见

2021-05 · 12 分钟 · 5725 字

四月  3

AST:视觉 Transformer 是如何学会聆听的

2021-04 · 7 分钟 · 3212 字

用手术刀探测:发现语言模型已知的内容

2021-04 · 7 分钟 · 3105 字

GANcraft:用 AI 将我的世界(Minecraft)世界变为照片般逼真的现实

2021-04 · 7 分钟 · 3391 字

三月  4

CLIP 解析:用语言教视觉模型(以及为什么有效)

2021-03 · 15 分钟 · 7209 字

超越 MAML:自适应学习与任务优先化如何增强元学习

2021-03 · 6 分钟 · 2689 字

不止是回放,更要学会如何回放:用 MetaSGD 为持续学习增压

2021-03 · 6 分钟 · 2790 字

终身学习:梯度投影记忆如何战胜灾难性遗忘

2021-03 · 7 分钟 · 3289 字

二月  2

超越小样本:让元学习适用于大规模任务

2021-02 · 7 分钟 · 3424 字

数小时而非数天找到顶尖神经网络:深入解读免训练 NAS

2021-02 · 6 分钟 · 2809 字

一月  2

从像素到令牌:T2T‑ViT 如何让 Transformer 在 ImageNet 上发挥作用

2021-01 · 10 分钟 · 4526 字

Switch Transformer:一个出乎意料高效的万亿参数 AI 模型

2021-01 · 7 分钟 · 3294 字

2020  37

十二月  2

从 O(n²) 到 O(n):深入探究极速 WordPiece 分词算法

2020-12 · 6 分钟 · 2547 字

SpAtten:通过剪枝冗余语言,让 Transformer 更加“斯巴达”

2020-12 · 6 分钟 · 2859 字

十一月  3

借助文本信息,提升小样本学习能力

2020-11 · 7 分钟 · 3115 字

学会学习:人工智能能教给我们关于大脑的什么(以及反之亦然)

2020-11 · 7 分钟 · 3238 字

超越偏差与方差:精细审视双下降现象

2020-11 · 10 分钟 · 4572 字

十月  4

如何教会 AI 新技能,又不忘旧本领

2020-10 · 7 分钟 · 3089 字

超越良好起点:PAMELA 如何学习快速适应的路径

2020-10 · 7 分钟 · 3247 字

Vision Transformer (ViT):教 Transformer 学会看图

2020-10 · 7 分钟 · 3152 字

LEAStereo – AI 如何学会设计顶尖的 3D 视觉模型

2020-10 · 7 分钟 · 3342 字

八月  1

超越双重下降:泛化的多尺度理论

2020-08 · 7 分钟 · 3225 字

七月  1

永不遗忘:La-MAML 如何教模型进行持续学习

2020-07 · 7 分钟 · 3092 字

六月  5

神经网络剪枝的隐藏规则:深入探究缩放定律

2020-06 · 7 分钟 · 3267 字

让 Transformer 飞起来 —— 深入探究线性注意力

2020-06 · 7 分钟 · 3065 字

数秒内找到顶级神经网络——无需任何训练

2020-06 · 6 分钟 · 2632 字

从噪声到高保真图像——深入解读去噪扩散模型

2020-06 · 5 分钟 · 2372 字

从过去中学习:保守 Q 学习如何解锁离线强化学习

2020-06 · 6 分钟 · 2710 字

五月  4

RAG:如何让你的大语言模型进行一场开卷考试

2020-05 · 7 分钟 · 3329 字

超越成对比较:用上下文提升小样本学习

2020-05 · 7 分钟 · 3169 字

超越最后一层:赋予解码器立体视觉,实现更智能的文本生成

2020-05 · 7 分钟 · 3116 字

超越最后一层:用多视角解码为 Transformer 注入强劲动力

2020-05 · 7 分钟 · 3240 字

四月  5

机器如何学会学习:元学习深度指南

2020-04 · 10 分钟 · 4968 字

学会学习:深入探索元学习的全景

2020-04 · 7 分钟 · 3079 字

从像素学习的速度大幅提升:深入解析 CURL

2020-04 · 5 分钟 · 2327 字

超越在线训练:介绍用于真实世界离线强化学习的 D4RL

2020-04 · 6 分钟 · 2973 字

YOLOv4: 打破速度与精度的平衡难题,单GPU即可训练的最强检测器

2020-04 · 5 分钟 · 2149 字

三月  4

聪明剪枝,而非蛮力:深入解析学习阈值剪枝

2020-03 · 6 分钟 · 2936 字

剪枝悖论:为何我们无法判断哪种神经网络剪枝方法是最好的

2020-03 · 8 分钟 · 3831 字

驯服二次方猛兽——路由 Transformer 如何扩展至超长序列

2020-03 · 6 分钟 · 2827 字

BigNAS:一次训练,随处部署的单阶段神经架构搜索

2020-03 · 6 分钟 · 2935 字

二月  5

超越黑箱:元学习为何如此擅长小样本学习?

2020-02 · 7 分钟 · 3009 字

MAML 为何有效?深入探究元学习理论

2020-02 · 7 分钟 · 3015 字

方差的惊人形状:重新思考深度学习中的偏差-方差权衡

2020-02 · 7 分钟 · 3124 字

训练更少,收获更多:对抗训练中过拟合的惊人真相

2020-02 · 7 分钟 · 3357 字

Backpropamine:教神经网络自我重构

2020-02 · 7 分钟 · 3156 字

一月  3

破解一次性 NAS 的密码:深入解析 NAS-Bench-1Shot1 基准

2020-01 · 6 分钟 · 2921 字

神经网络的公平竞技场:深入解析 NAS-Bench-201

2020-01 · 6 分钟 · 2777 字

量变引起质变 —— 语言模型性能惊人的可预测性

2020-01 · 6 分钟 · 2980 字

2019  15

十一月  1

能教会老模型新把戏吗?深入探究迁移学习

2019-11 · 9 分钟 · 4269 字

十月  4

超越“一刀切”的元学习:深入解读 MMAML

2019-10 · 7 分钟 · 3418 字

压缩、挑选、增长:一种更智能的 AI 无遗忘学习方式

2019-10 · 6 分钟 · 2892 字

超越 8 位:BitNet 如何让你的数字世界更平滑

2019-10 · 6 分钟 · 2883 字

从 ZeRO 到万亿:深入探究巨型 AI 模型背后的内存优化技术

2019-10 · 6 分钟 · 2979 字

九月  4

超越简单比较:PARN 如何教会网络“看见”物体的位置

2019-09 · 7 分钟 · 3295 字

稳定性–可塑性困境:持续学习研究导览

2019-09 · 10 分钟 · 5003 字

不要只测试——也要训练!利用自监督实时适应新数据

2019-09 · 7 分钟 · 3097 字

Megatron-LM:借助优雅的 PyTorch 并行化,将语言模型扩展至数十亿参数

2019-09 · 5 分钟 · 2486 字

六月  1

自适应地学习如何学习:深入解读 ARUBA 框架

2019-06 · 6 分钟 · 2951 字

五月  3

学会适应:深入解析 TapNet 在小样本分类中的投影力量

2019-05 · 7 分钟 · 3088 字

Alpha MAML:解除元学习中的超参数困扰

2019-05 · 6 分钟 · 2818 字

即时生成神经网络:深入解析 LGM-Net

2019-05 · 7 分钟 · 3492 字

三月  2

对齐,而非简单匹配:深入解读可解释的单样本学习

2019-03 · 7 分钟 · 3098 字

解读双下降:为什么更多参数能带来更好的模型

2019-03 · 4 分钟 · 1939 字

2018  23

十二月  4

超越微调:元迁移学习如何掌握小样本识别

2018-12 · 7 分钟 · 3082 字

超越单一起点:面向多样化和不相交任务的元学习

2018-12 · 6 分钟 · 2878 字

终身学习,既不遗忘(也不破产):深入解析 A-GEM

2018-12 · 7 分钟 · 3353 字

ProxylessNAS:直接在你的目标硬件上搜索最优神经网络

2018-12 · 6 分钟 · 2737 字

十一月  1

别忘了!经验回放如何解决人工智能的“失忆”问题

2018-11 · 7 分钟 · 3130 字

十月  1

深入解析 BERT:双向 Transformer 如何重新定义 NLP

2018-10 · 7 分钟 · 3355 字

七月  1

在潜在仙境中学习如何学习:深入解析 LEO

2018-07 · 8 分钟 · 3609 字

六月  2

PLATIPUS——当一个模型无法满足小样本学习

2018-06 · 7 分钟 · 3311 字

教神经网络如何记忆:深入探索元持续学习

2018-06 · 6 分钟 · 2951 字

五月  1

超越翻转与裁剪:AutoAugment 如何教 AI 增强自身数据

2018-05 · 7 分钟 · 3011 字

四月  3

如何教会神经网络从单个样本中学习

2018-04 · 7 分钟 · 3060 字

一个句子,多种分词:子词正则化在神经机器翻译中的威力

2018-04 · 7 分钟 · 3091 字

YOLOv3:渐进式改进如何打造实时检测利器

2018-04 · 5 分钟 · 2178 字

三月  3

超越标注数据:无标签样本如何助力小样本学习

2018-03 · 7 分钟 · 3258 字

Reptile:一个简单而强大的元学习技巧

2018-03 · 8 分钟 · 3549 字

你的神经网络中彩票了吗?解析“彩票假说”

2018-03 · 7 分钟 · 3402 字

二月  5

超越固定距离:条件嵌入如何重新定义小样本学习

2018-02 · 6 分钟 · 2938 字

超越原始像素:深度元学习如何教AI学习概念

2018-02 · 6 分钟 · 2966 字

解锁 AI 的终身学习:受大脑启发的门控机制如何防止灾难性遗忘

2018-02 · 7 分钟 · 3246 字

ELMo:语境与深度表示如何永久改变了 NLP

2018-02 · 6 分钟 · 2847 字

ENAS:让神经架构搜索快 1000 倍

2018-02 · 6 分钟 · 2995 字

一月  2

向终身学习致敬:硬注意力(HAT)如何防止神经网络失忆

2018-01 · 5 分钟 · 2123 字

Piggyback:让老网络掌握新技巧而不遗忘

2018-01 · 7 分钟 · 3293 字

2017  20

十二月  1

PNAS:如何在不耗尽资源的情况下找到顶级性能的神经网络

2017-12 · 5 分钟 · 2504 字

十一月  5

从少量样本中学习:深入解析用于小样本学习的图神经网络

2017-11 · 7 分钟 · 3280 字

以少胜多:利用无标签数据和智能查询增强原型网络

2017-11 · 6 分钟 · 2770 字

关系网络如何通过学习比较掌握小样本学习

2017-11 · 7 分钟 · 3159 字

用可扩展的回忆解决人工智能的“失忆症”

2017-11 · 8 分钟 · 3513 字

对抗 AI 遗忘症:PackNet 如何在不忘记旧知识的情况下教会网络新技巧

2017-11 · 7 分钟 · 3430 字

十月  1

超越 ReLU:自动化搜索如何发现 Swish 激活函数

2017-10 · 6 分钟 · 2522 字

八月  1

NLP 的“ImageNet 时刻”?机器翻译如何为我们带来情境化词向量

2017-08 · 7 分钟 · 3103 字

七月  2

快速学会学习:深入解析 Meta-SGD

2017-07 · 6 分钟 · 2883 字

PPO详解:易于实现、难以超越的强化学习算法

2017-07 · 6 分钟 · 2734 字

六月  2

永不忘记任务:深入解析梯度情节记忆 (GEM)

2017-06 · 7 分钟 · 3336 字

剖析 Transformer:这篇论文彻底改变了 NLP

2017-06 · 7 分钟 · 3110 字

五月  2

更快、更强、卷积:一种新的机器翻译架构

2017-05 · 8 分钟 · 3656 字

从像素到毕加索:深入探索神经风格迁移

2017-05 · 5 分钟 · 2298 字

三月  6

超越 Adam:我们能为神经网络学习一个更好的优化器吗?

2017-03 · 7 分钟 · 3502 字

教 AI 学会优化:学习型优化器如何实现扩展与泛化

2017-03 · 7 分钟 · 3366 字

用原型学习“如何学习”:深入解析原型网络

2017-03 · 7 分钟 · 3045 字

MAML:如何学会学习(无需天才)

2017-03 · 7 分钟 · 3282 字

神经网络能终身学习吗?深入解析突触智能

2017-03 · 7 分钟 · 3496 字

超越边界框:深入解析 Mask R-CNN

2017-03 · 7 分钟 · 3022 字

2016  13

十二月  2

解决 AI 的“失忆症”:深入解析弹性权重巩固

2016-12 · 7 分钟 · 3419 字

YOLO9000: 一个能识别9000种物体的实时检测器

2016-12 · 6 分钟 · 2736 字

十一月  3

永不遗忘:iCaRL 如何让深度学习模型持续学习

2016-11 · 7 分钟 · 3028 字

如何训练一个 AI 来设计其他 AI:深入解析神经架构搜索

2016-11 · 6 分钟 · 2757 字

ResNeXt:为深度神经网络设计增加一个新维度

2016-11 · 6 分钟 · 2612 字

九月  1

超网络——当一个神经网络学会构建另一个网络

2016-09 · 7 分钟 · 3164 字

七月  1

FastText 详解:字符 N‑gram 如何彻底改变词嵌入

2016-07 · 7 分钟 · 3253 字

六月  5

一击定乾坤——匹配网络如何从单个样本中学习

2016-06 · 7 分钟 · 3303 字

统领全场的 AI:训练神经网络成为优化器

2016-06 · 7 分钟 · 3129 字

基于经验构建:渐进式网络如何在不遗忘的情况下进行序列学习

2016-06 · 3 分钟 · 1168 字

如何教 AI 新技能,同时不让它忘记旧本领

2016-06 · 6 分钟 · 2732 字

超越切片:V-Net 如何彻底改变 3D 医学图像分割

2016-06 · 5 分钟 · 2444 字

二月  1

忘掉经验回放:深度强化学习中的 A3C 革命

2016-02 · 7 分钟 · 3114 字

2015  13

十二月  2

为什么你的 RNN 会过拟合——以及如何用贝叶斯 Dropout 解决它

2015-12 · 7 分钟 · 3015 字

更智能,而非更堆砌:谷歌 Inception V2 和 V3 如何重新思考深度学习架构

2015-12 · 6 分钟 · 2579 字

十一月  1

DCGAN 详解:利用生成式 AI 解锁无监督学习的力量

2015-11 · 5 分钟 · 2385 字

十月  1

CNN文本分类超参数终极指南

2015-10 · 7 分钟 · 3392 字

八月  2

超越单词:亚词单元如何解决机器翻译的核心难题

2015-08 · 7 分钟 · 3072 字

内容与风格:教会计算机像梵高一样绘画的算法

2015-08 · 6 分钟 · 2687 字

六月  4

打开黑箱:LSTM 如何学习长程依赖

2015-06 · 6 分钟 · 2550 字

Faster R-CNN: 让实时目标检测成为可能的突破性技术

2015-06 · 5 分钟 · 2179 字

YOLO:让计算机视觉实现实时检测的革命性突破

2015-06 · 6 分钟 · 2549 字

YOLO: 一眼识别世界的实时目标检测革命

2015-06 · 6 分钟 · 2525 字

五月  1

U-Net: 用小数据实现精准分割的深度学习架构

2015-05 · 5 分钟 · 2415 字

三月  1

终极LSTM对决:深入探索《搜索空间奥德赛》

2015-03 · 6 分钟 · 2917 字

二月  1

重新思考深度 RNN:门控反馈连接的力量

2015-02 · 5 分钟 · 2326 字

2014  11

十二月  2

LSTM vs. GRU:门控循环神经网络的对决

2014-12 · 6 分钟 · 2695 字

Adam优化器深度解析:现代深度学习的秘密武器

2014-12 · 5 分钟 · 2132 字

十一月  2

通用 vs. 专用:深入探究神经网络特征的可迁移性

2014-11 · 6 分钟 · 2771 字

FCN: 让 CNN 实现像素级语义分割的开创性工作

2014-11 · 5 分钟 · 2417 字

十月  1

教神经网络像计算机一样思考:神经图灵机

2014-10 · 5 分钟 · 2186 字

九月  3

突破瓶颈:注意力机制如何彻底改变神经机器翻译

2014-09 · 7 分钟 · 3488 字

开启现代自然语言处理革命的论文:理解基于 LSTM 的 Seq2Seq 模型

2014-09 · 6 分钟 · 2678 字

让 Dropout 在 RNN 上奏效的简单技巧

2014-09 · 6 分钟 · 2786 字

六月  3

GANs详解:深入解读开创时代的奠基之作

2014-06 · 7 分钟 · 3192 字

教机器看哪里:深入解析循环视觉注意力模型

2014-06 · 7 分钟 · 3391 字

打破固定尺寸限制:SPP-net 如何让 CNN 快 100 倍

2014-06 · 5 分钟 · 2470 字

2013  5

十二月  2

深度Q网络:人工智能如何从像素称霸雅达利游戏

2013-12 · 7 分钟 · 3326 字

解锁生成模型:深入解析变分自编码器

2013-12 · 8 分钟 · 3560 字

十一月  2

R-CNN: 深度学习如何彻底革新目标检测

2013-11 · 6 分钟 · 2671 字

打开黑盒:揭秘CNN如何学会"看见"

2013-11 · 6 分钟 · 2531 字

一月  1

引爆革命的论文:深入解读Word2Vec

2013-01 · 6 分钟 · 2810 字

2012  1

六月  1

从像素到概念:表征学习的力量

2012-06 · 11 分钟 · 5086 字

2011  1

三月  1

重新思考自然语言处理:如何(几乎)从零开始构建一个顶级标注器

2011-03 · 8 分钟 · 3580 字