Home
|
En
Tags
Search
Archive
Archive
2025
696
十一月
50
在线梯度变化如何在 Hölder 平滑性下解锁通用加速
2025-11
·
11 分钟
·
5422 字
EraseFlow:通过引导去噪轨迹擦除不需要的概念
2025-11
·
16 分钟
·
7811 字
当建议有用时:用不完美预测学习乘积分布
2025-11
·
12 分钟
·
5706 字
你需要多少自适应性?理解按需采样中的样本—轮次权衡
2025-11
·
13 分钟
·
6219 字
FlowFeat:教图像记住运动 — 高分辨率、运动感知的像素特征
2025-11
·
15 分钟
·
7388 字
揭开置信:KLASS 如何加速并稳定掩码扩散采样
2025-11
·
12 分钟
·
5654 字
从照片到物理:URDF-Anything 如何用 3D MLLM 构建可执行的数字孪生
2025-11
·
17 分钟
·
8241 字
超越偏好:AI 模型是否理解我们最深层的价值观?
2025-11
·
19 分钟
·
9418 字
PCA++ — 为什么将特征分散开能使对比式 PCA 对结构化噪声更稳健
2025-11
·
13 分钟
·
6506 字
CTRL-ALT-DECEIT:AI 智能体会破坏你的代码吗?深度解析
2025-11
·
9 分钟
·
4446 字
AI能发现新数学吗?教机器理解数学理论中的“有趣”
2025-11
·
7 分钟
·
3329 字
破解图 Transformer 的密码:统一理论与实践的框架
2025-11
·
10 分钟
·
4619 字
ATHENA:AI 如何融合符号数学与语言来预测你的个人选择
2025-11
·
9 分钟
·
4463 字
更聪明,而非更费力:LeMiCa 如何通过全局思维加速 AI 视频生成
2025-11
·
6 分钟
·
2948 字
更聪明,而非更费力:EPIC 如何教大语言模型选择最佳推理策略
2025-11
·
7 分钟
·
3317 字
解锁鲁棒的 3D 视觉:深入解析 Cycle-Sync
2025-11
·
8 分钟
·
3524 字
超越固定步长:前向曲率匹配如何解锁灵活的 3D 重建
2025-11
·
6 分钟
·
2982 字
快速找到所有优质模型:深入解析 SORTeD
2025-11
·
7 分钟
·
3057 字
解释之前先校准:深度剖析 ReCalX,构建可信赖的 AI
2025-11
·
7 分钟
·
3468 字
FAPEX:以分数阶微积分驯服脑电波,实现通用癫痫预测
2025-11
·
7 分钟
·
3250 字
现实的几何学:通过理解自然图像来检测 AI 生成图像
2025-11
·
6 分钟
·
2574 字
定位的极限:带噪距离查询能(和不能)揭示什么
2025-11
·
7 分钟
·
3485 字
虚拟宽度网络:突破二次瓶颈,扩展 Transformer
2025-11
·
6 分钟
·
2920 字
Depth Anything 3:单个 Transformer 看懂三维世界
2025-11
·
6 分钟
·
2879 字
为什么去噪模型应该真正去噪:深入解读 JiT
2025-11
·
7 分钟
·
3010 字
本地 AI 的崛起:用“每瓦智能”衡量并重塑云端
2025-11
·
7 分钟
·
3332 字
与陪练伙伴一起训练大语言模型:深入解析 RLAC
2025-11
·
7 分钟
·
3034 字
超越记忆:强化学习如何教会大语言模型导航知识
2025-11
·
7 分钟
·
3355 字
LLM 的贝叶斯大脑:提示与激活引导如何塑造模型信念
2025-11
·
6 分钟
·
2746 字
WebVIA:探索、编码并验证交互式网站的 AI 智能体
2025-11
·
9 分钟
·
4033 字
超越静态数据:LoopTool 的自校正循环如何打造更智能的 LLM 代理
2025-11
·
7 分钟
·
3206 字
在梦境中训练机器人:WMPO 如何教机器人从想象的失败中学习
2025-11
·
7 分钟
·
3142 字
思考快,表达准:TiDAR 如何解锁 6 倍 LLM 推理速度
2025-11
·
6 分钟
·
2947 字
大语言模型的钢丝——开发者如何在 AI 编程助手的机遇与风险间取得平衡
2025-11
·
7 分钟
·
3123 字
赋予LLM记忆:生成式语义工作空间如何帮助AI理解故事
2025-11
·
8 分钟
·
3747 字
超越置信度:KLASS 如何利用稳定性解锁更快、更优的扩散模型
2025-11
·
6 分钟
·
2704 字
从谱到信号原则:一个成本仅 8 千美元的小模型如何学会像 AI 巨头一样推理
2025-11
·
6 分钟
·
2998 字
我的AI记得什么?揭示AI记忆中隐藏的幻觉
2025-11
·
8 分钟
·
3646 字
藏于无形:NINJA 攻击如何利用长上下文绕过大语言模型安全机制
2025-11
·
7 分钟
·
3179 字
超越离散思维:SofT-GRPO 如何让 LLM 在连续空间中推理
2025-11
·
5 分钟
·
2250 字
超越上下文窗口:IterResearch 如何教 AI 智能体思考、综合并攻克复杂问题
2025-11
·
8 分钟
·
3625 字
Dr. MAMR:如何让 AI 智能体不再“偷懒”,提升协同推理能力
2025-11
·
7 分钟
·
3182 字
用人工智能解锁数学发现:深入剖析 AlphaEvolve
2025-11
·
11 分钟
·
5111 字
超越智能体级搜索:工具到智能体检索如何为 LLM 系统赋能
2025-11
·
6 分钟
·
2792 字
DreamGym:在合成世界中训练 AI 智能体,以掌控真实世界
2025-11
·
7 分钟
·
3441 字
超越正确答案:深入解读 IMO-Bench,人工智能数学能力的新黄金标准
2025-11
·
7 分钟
·
3345 字
Transformer 能中彩票吗?一项新证明在注意力机制中找到了中奖彩票
2025-11
·
7 分钟
·
3138 字
交叉点:在数据稀缺的世界中,扩散模型如何超越大型语言模型
2025-11
·
8 分钟
·
3665 字
超越视觉:V-Thinker 如何教 AI 与图像交互以实现更深层次的推理
2025-11
·
7 分钟
·
3409 字
Sora-2 会思考吗?探索“以视频为思考”的新范式
2025-11
·
7 分钟
·
3362 字
十月
159
当直线失效:梯度方差如何揭露整流流中的记忆化
2025-10
·
16 分钟
·
7778 字
TrajMamba 解读:快速、目的感知的车辆轨迹嵌入
2025-10
·
16 分钟
·
7886 字
Teaching Machines to ‘See’ Space: Grid-Based Spatial Intelligence for Autonomous Driving
2025-10
·
14 分钟
·
6646 字
像拼乐高一样拼接计划:C‑MCTD 如何让扩散规划器进行全局思考
2025-10
·
18 分钟
·
8955 字
Diff-ABFlow — 用帧+事件融合与扩散解决模糊与夜间光流
2025-10
·
15 分钟
·
7345 字
一步到位:岭提升如何同时实现稳健性与半参数效率
2025-10
·
13 分钟
·
6074 字
教会模型选择性地遗忘:视觉-语言模型的近似领域遗忘
2025-10
·
15 分钟
·
7493 字
读懂(驾驶者的)思维:使用注意力感知的逆向规划从动作推断注意力偏差
2025-10
·
17 分钟
·
8413 字
拉伸表示:最小生成树如何帮助自监督学习
2025-10
·
17 分钟
·
8070 字
当人们只在意少数选项时:使用广义 Top-k Mallows 模型进行采样、选择与学习
2025-10
·
14 分钟
·
6662 字
扰动输入,而非参数 — 在上下文赌博机中的特征扰动
2025-10
·
9 分钟
·
4458 字
SGD 如何学习最优传输映射:投影 SGD、受限强凸性与极小-极大速率
2025-10
·
14 分钟
·
6724 字
GSAC 解析:因果性与局部性如何使多智能体 RL 可扩展且快速自适应
2025-10
·
11 分钟
·
5123 字
角度引导 — 旋转 LLM 激活以引导行为:直观深入解析
2025-10
·
17 分钟
·
8024 字
为智能体照亮世界:ESCA 如何用场景图为具身 AI 提供落地感
2025-10
·
16 分钟
·
7652 字
2025-10
·
13 分钟
·
6336 字
夺回剪枝带走的东西:通过缺失组件补偿恢复LLM(RestoreLCC)
2025-10
·
11 分钟
·
5407 字
看见并说明原因:DEXTER 如何在无数据情况下结合扩散与大模型解释视觉模型
2025-10
·
12 分钟
·
5532 字
保留有效部分,修正其余:迁移学习如何帮助最小范数插值器泛化
2025-10
·
12 分钟
·
5705 字
更锋利的隐私之剑——f-DP 如何在去中心化网络中释放更强大的 AI
2025-10
·
7 分钟
·
3340 字
用经典统计学解锁稳健的 LLM 水印检测
2025-10
·
6 分钟
·
2916 字
OnlineSplatter:为运动世界打造的实时三维视觉
2025-10
·
7 分钟
·
3371 字
超越事实:LLM 如何将知识压缩为可复用的“属性”
2025-10
·
7 分钟
·
3277 字
Head Pursuit:揭示并编辑 AI 模型内部的“概念旋钮”
2025-10
·
7 分钟
·
3207 字
为什么公平的系统会造成不公平的结果——深入探讨感知偏见
2025-10
·
10 分钟
·
4776 字
我的机器人试图打开一个锁着的抽屉:为什么大语言模型需要面对现实
2025-10
·
7 分钟
·
3505 字
超越静态场景:ROGR如何利用AI在任何环境中重照明3D对象
2025-10
·
7 分钟
·
3145 字
那是你的模型吗?用“重写本”式记忆证明 AI 的身世
2025-10
·
7 分钟
·
3008 字
为什么更多通信有助于(但无法完全解决)去中心化学习:理解多步 Gossip
2025-10
·
7 分钟
·
3202 字
HEDGE已是最佳选择?——深入探讨组合在线学习
2025-10
·
8 分钟
·
3739 字
驯服长尾:深入解析信息保持的两阶段学习
2025-10
·
7 分钟
·
3333 字
旋度下降:当“横向移动”能帮助神经网络更快学习时
2025-10
·
8 分钟
·
3562 字
解锁大脑‘黑箱’:雅可比矩阵如何揭示非线性视觉处理
2025-10
·
8 分钟
·
3572 字
EPHAD:让异常检测从真实世界的数据污染中获救
2025-10
·
7 分钟
·
3186 字
驯服延迟怪兽——当反馈姗姗来迟时的智能决策
2025-10
·
7 分钟
·
3167 字
从分数到谱分布:补全不确定知识图谱的新方法
2025-10
·
7 分钟
·
3020 字
AI 的大脑 GPS:网格状编码如何构建更智能的世界模型
2025-10
·
7 分钟
·
3419 字
消失于无形:深入解析针对 SAM2 的对抗攻击
2025-10
·
7 分钟
·
3016 字
冗余悖论:掩盖旧数据如何改进时间序列预测
2025-10
·
6 分钟
·
2901 字
超越像素——利用物理定律揭示AI生成视频
2025-10
·
8 分钟
·
3657 字
鱼与熊掌兼得:混合平衡 GFlowNet 如何攻克车辆路径问题
2025-10
·
7 分钟
·
3059 字
教 AI 看你所看:深入解析条件表征学习
2025-10
·
7 分钟
·
3360 字
别那样做!用未来视野和人类直觉教机器人
2025-10
·
7 分钟
·
3069 字
稀疏性的形状:Graphon 如何揭示神经网络剪枝的秘密
2025-10
·
8 分钟
·
3807 字
LLM 黑客攻击的普适定律:用“每查询比特数”衡量安全
2025-10
·
7 分钟
·
3093 字
贝尔曼–詹森差距:解锁强化学习中预测的真正价值
2025-10
·
8 分钟
·
3769 字
超越像素:SegMASt3R 如何精通 3D 感知分割匹配
2025-10
·
7 分钟
·
3466 字
超越精美图片:利用数据增强进行因果推断
2025-10
·
7 分钟
·
3466 字
超越全上下文:Memo 如何为 Transformer 打造更智能、更精简的记忆
2025-10
·
7 分钟
·
3142 字
一个模型应对所有场景:MDReID 如何破解目标重识别中的模态混合与匹配难题
2025-10
·
6 分钟
·
2886 字
超越上下文窗口:Vgent 的图驱动长视频理解方法
2025-10
·
7 分钟
·
3274 字
用“能量”解决复杂难题:人工智能如何学会超越训练数据的推理能力
2025-10
·
7 分钟
·
3269 字
超越 LoRA:利用 StelLA 和几何优化学习更好的子空间
2025-10
·
7 分钟
·
3128 字
ReCon:教扩散模型在“框框”里涂色,实现更好的目标检测
2025-10
·
6 分钟
·
2963 字
DiPro:人工智能如何通过分离信号与噪声来追踪疾病
2025-10
·
7 分钟
·
3123 字
聚类混沌:DynaInfer 如何学习分离和泛化动力系统
2025-10
·
6 分钟
·
2760 字
教脉冲无人机飞行:自适应梯度与“跳跃启动”强化学习
2025-10
·
7 分钟
·
3476 字
流畅动作的秘密:解读用于长运动生成的组合式相位扩散模型
2025-10
·
6 分钟
·
2939 字
Transformer 训练的两阶段:从凝聚到秩坍塌
2025-10
·
7 分钟
·
3447 字
填补泛化理论的漏洞——随机投影与压缩如何修复 CMI 界
2025-10
·
9 分钟
·
4444 字
超越平面世界:利用 HyperET 在双曲空间中训练更智能的多模态 AI
2025-10
·
7 分钟
·
3212 字
噪声究竟如何扭曲你的数据?以更锐利的视角审视低秩近似
2025-10
·
7 分钟
·
3370 字
你的数据“形状”有多脆弱?深入探索噪声下的低秩近似
2025-10
·
7 分钟
·
3193 字
万物皆热核:统一组合贝叶斯优化的狂野西部
2025-10
·
7 分钟
·
3251 字
FunLoRA:让 AI 永远学习而不遗忘的巧妙技巧
2025-10
·
7 分钟
·
3261 字
抛弃键与值:通往终身学习的极简主义之路
2025-10
·
7 分钟
·
3317 字
解码上下文学习:为什么 Transformer 可能是隐藏的贝叶斯统计学家
2025-10
·
7 分钟
·
3219 字
超越对错:教LLM判断自身置信度
2025-10
·
7 分钟
·
3096 字
超越百万词元:为长上下文大语言模型构建真实测试与真实记忆
2025-10
·
8 分钟
·
3594 字
超越文本:强化学习与工具如何打造更智能的 LLM 评委
2025-10
·
7 分钟
·
3226 字
从原始计算机到超人 AI:情境工程的隐藏历史与未来
2025-10
·
8 分钟
·
3566 字
超越集合通信:TransferEngine 如何为现代大语言模型解锁可移植的高速通信
2025-10
·
7 分钟
·
3290 字
LLM 微调不稳定的真正罪魁祸首?可能是你的浮点数。
2025-10
·
8 分钟
·
3730 字
Agent Data Protocol:训练更智能 LLM 智能体的通用翻译器
2025-10
·
7 分钟
·
3420 字
AI 们为何意见不合?压力测试它们背后的规则手册
2025-10
·
7 分钟
·
3434 字
超越顺序思维:基于图的规划如何为 LLM 智能体解锁并行能力
2025-10
·
7 分钟
·
3138 字
你的AI懂了吗?一项新的全球基准如何测试116种语言的AI常识
2025-10
·
9 分钟
·
4426 字
提出、解决、评判:单一 LLM 如何通过自我进化学会推理
2025-10
·
6 分钟
·
2912 字
AgentFold:通过整理工作空间,让 AI 像人类一样思考
2025-10
·
7 分钟
·
3392 字
芯片上的衔尾蛇:循环语言模型如何学会“更深”而非“更广”地思考
2025-10
·
9 分钟
·
4463 字
超越模仿:使用 PORTool 教会大语言模型探索与推理工具
2025-10
·
7 分钟
·
3241 字
超越模仿:用监督强化学习教大语言模型进行分步推理
2025-10
·
7 分钟
·
3103 字
超越思维链:异步思考如何解锁协作式人工智能
2025-10
·
6 分钟
·
2851 字
OmniX:利用 AI 将单张图像转变为可交互的 3D 世界
2025-10
·
7 分钟
·
3154 字
ORCA:如何用图像生成器教机器人
2025-10
·
6 分钟
·
2985 字
隆重推出 AMO-Bench:AI 数学推理的全新试炼场
2025-10
·
7 分钟
·
3192 字
Emu3.5:十年视频训练如何教会 AI 理解我们的世界
2025-10
·
10 分钟
·
4701 字
超越 Softmax:Kimi Linear 如何重新定义大语言模型的效率与性能
2025-10
·
8 分钟
·
3696 字
AutoDeco:教语言模型自我引导,无需手动调参
2025-10
·
7 分钟
·
3014 字
头碰头:简单的头间通信如何改进 Transformer 模型
2025-10
·
6 分钟
·
2688 字
超越检索:E²RANK 如何将文本嵌入模型变为强大的重排器
2025-10
·
7 分钟
·
3388 字
超越重建:IGGT 如何让 AI 像人类一样理解三维场景
2025-10
·
8 分钟
·
3641 字
追逐幻影:‘前瞻锚定’如何解决 AI 生成视频中的身份漂移问题
2025-10
·
7 分钟
·
3020 字
FARMER:用自回归流播下下一代图像生成的种子
2025-10
·
4 分钟
·
1619 字
从助手到自主科学家:数据智能体未来发展的六级指南
2025-10
·
9 分钟
·
4150 字
ReCode:统一规划与行动,打造更智能、更具适应性的 AI 智能体
2025-10
·
6 分钟
·
2883 字
超越平面世界:Concerto如何通过融合视觉与触觉教机器看懂3D
2025-10
·
6 分钟
·
2920 字
解锁 AI 视频的创意控制:深入解析 Video-As-Prompt (VAP) 框架
2025-10
·
7 分钟
·
3283 字
DeepAgent:教会 AI 自主思考、发现工具并独立解决复杂问题
2025-10
·
7 分钟
·
3396 字
超越简单滤镜:Pico-Banana-400K 如何训练更智能的 AI 图像编辑器
2025-10
·
7 分钟
·
3126 字
WorldGrow:逐块构建无限、逼真的3D世界
2025-10
·
7 分钟
·
3360 字
打破错误级联:ReDiff 如何教会 AI 纠正自身错误
2025-10
·
6 分钟
·
2826 字
从“步”到“块”:强化学习如何让 AI 图像生成更智能
2025-10
·
7 分钟
·
3163 字
超越准确率:深入剖析 HAL,AI 智能体评估的新标准
2025-10
·
9 分钟
·
4273 字
HERO:融合稀疏规则与密集奖励,增强 LLM 的推理能力
2025-10
·
7 分钟
·
3119 字
Dr.LLM 简介:通过动态层路由升级 LLM,实现更高准确率与更低计算量
2025-10
·
7 分钟
·
3336 字
Elastic-Cache:通过重新思考 KV 缓存,让扩散大语言模型快如闪电
2025-10
·
6 分钟
·
2816 字
AI 团队协作的秘密:揭示 LLM 智能体中的涌现协同效应
2025-10
·
7 分钟
·
3207 字
如何训练更聪明的 AI 智能体:深入解析智能体强化学习
2025-10
·
7 分钟
·
3317 字
从艺术到科学:扩展大型语言模型强化学习的原则性指南
2025-10
·
7 分钟
·
3181 字
超越黑箱:可控 AI 智能体如何革新企业研究
2025-10
·
8 分钟
·
3637 字
Prompt-MII:教大语言模型自己写指令,推理成本降低 13 倍
2025-10
·
7 分钟
·
3175 字
超越自动化:ColorAgent 如何将你的手机 AI 变为真正的伙伴
2025-10
·
7 分钟
·
3355 字
Ring-1T:走进重新定义推理的万亿参数 AI 内部
2025-10
·
7 分钟
·
3007 字
窥探未来:‘Lookahead 路由’如何让大模型做出更智能的选择
2025-10
·
7 分钟
·
3430 字
解锁你 LLM 的隐藏天赋:无需训练
2025-10
·
7 分钟
·
3025 字
修复 LLM 的遗忘症:深入解析稀疏记忆微调
2025-10
·
6 分钟
·
2989 字
AI 也会得“脑腐”吗?垃圾数据如何让大语言模型变笨
2025-10
·
7 分钟
·
3064 字
QeRL:将量化噪声转化为推理型 LLM 的超能力
2025-10
·
7 分钟
·
3070 字
超越 VAE:表征自编码器成为扩散 Transformer 的新默认方案
2025-10
·
6 分钟
·
2703 字
超越视觉与听觉:深入解析 OmniVinci 的全模态 AI
2025-10
·
7 分钟
·
3191 字
Nano3D:无需训练或掩码,轻松实现一致的3D编辑
2025-10
·
8 分钟
·
3581 字
BLIP3o-NEXT:混合式 AI 架构如何重新定义图像生成与编辑
2025-10
·
6 分钟
·
2974 字
LightsOut:AI 如何通过绘制不存在之物在黑暗中视物
2025-10
·
7 分钟
·
3234 字
Skyfall-GS: 用 AI 从太空构建沉浸式 3D 城市
2025-10
·
7 分钟
·
3301 字
Ditto 与 Editto:百万合成视频如何革新 AI 视频编辑
2025-10
·
7 分钟
·
3081 字
几个坏例子如何带坏一个大语言模型:上下文学习的隐藏危险
2025-10
·
6 分钟
·
2742 字
告别 VAE:自监督特征如何为扩散模型强势赋能
2025-10
·
7 分钟
·
3173 字
更智能、更快速、更强大:一种全新的 LLM 推理理论框架
2025-10
·
7 分钟
·
3067 字
无用功:DeepPrune 如何将大语言模型推理成本削减超过 80%
2025-10
·
6 分钟
·
2949 字
不止于正确:为什么你的 AI 编程助手需要一次“感觉检查”
2025-10
·
7 分钟
·
3154 字
学会学习,一次一批:深入解析迭代式摊销推断
2025-10
·
6 分钟
·
2810 字
HyperAdaLoRA:由超网络驱动的升级,实现更快、更智能的 LLM 微调
2025-10
·
6 分钟
·
2804 字
超越思维链:并行思考与自我优化如何解锁更智能的 LLM
2025-10
·
7 分钟
·
3289 字
AgentFlow:训练大语言模型智能体高效思考、规划与使用工具
2025-10
·
7 分钟
·
3415 字
教 AI 思考、回溯和重试:深入解读 MM-HELIX
2025-10
·
5 分钟
·
2372 字
超越模仿:早期经验如何让智能体从自身错误中学习
2025-10
·
8 分钟
·
3913 字
MemMamba:教 AI“记笔记”,攻克超长序列难题
2025-10
·
7 分钟
·
3313 字
超越第一帧:介绍用于任意视频创作的 VideoCanvas
2025-10
·
7 分钟
·
3075 字
DreamOmni2:教 AI 用文字和图片编辑与创作图像
2025-10
·
7 分钟
·
3116 字
超越文本到视频:UniVideo 如何统一理解、生成与编辑
2025-10
·
7 分钟
·
3291 字
MASA:教AI模型‘思考自己的思考’
2025-10
·
6 分钟
·
2564 字
超越更长上下文:教长上下文语言模型用可复用推理进行
思考
2025-10
·
6 分钟
·
2813 字
推理火花:微小概率如何解锁 AI 的超强解题能力
2025-10
·
5 分钟
·
2502 字
ARTDECO:融合 SLAM 与基础模型,打造完美的即时 3D 世界
2025-10
·
6 分钟
·
2524 字
受大脑启发的 AI:人工海马体网络如何赋予大语言模型长期记忆
2025-10
·
6 分钟
·
2677 字
为什么 AI 助手是糟糕的模拟用户——以及“翻转对话”如何解决这个问题
2025-10
·
7 分钟
·
3028 字
忘掉像素,生成代码:深入解读 Code2Video 如何创作教育视频
2025-10
·
6 分钟
·
2652 字
一个智能体很好,十个更好:扩展策略如何解锁AI计算机助手的近人类性能
2025-10
·
6 分钟
·
2968 字
少即是多:微型递归网络如何在复杂谜题上超越巨型 AI 模型
2025-10
·
7 分钟
·
3111 字
人工智能领域的龟兔赛跑:渐进式学习如何让视觉 AI 更快
2025-10
·
6 分钟
·
2601 字
RECAP:通过展示有缺陷的推理来教 AI 批判性思考
2025-10
·
6 分钟
·
2629 字
中段训练即可满足全部需求:一个 15B 模型如何触及 AI 前沿
2025-10
·
6 分钟
·
2903 字
LongCodeZip:让大语言模型读懂你的整个代码库,还不用花大钱
2025-10
·
6 分钟
·
2539 字
藏于虚空:StealthAttack 如何对 3D 场景进行投毒
2025-10
·
6 分钟
·
2759 字
小而强大:ModernVBERT 如何重新定义视觉文档检索
2025-10
·
3 分钟
·
1423 字
从秒到分钟:Self-Forcing++ 如何教会 AI 生成长视频
2025-10
·
6 分钟
·
2618 字
AI 能战胜华尔街吗?用 STOCKBENCH 在股市中测试 LLM 代理
2025-10
·
5 分钟
·
2505 字
别浪费你的错误:智能经验回放如何解锁大语言模型的推理能力
2025-10
·
6 分钟
·
2722 字
九月
82
用聪明的干预破解循环:线性非高斯模型的近最优实验设计
2025-09
·
12 分钟
·
5853 字
Neptune-X — 教会视觉模型看见大海:用于更好海事检测的生成数据 + 智能抽样
2025-09
·
14 分钟
·
6651 字
形式胜过含义:大型语言模型如何学会将句法与领域关联
2025-09
·
15 分钟
·
7125 字
移位的后继:为什么跳过几步能让低秩强化学习奏效
2025-09
·
6 分钟
·
2898 字
教单一大模型进行检索与推理:剖析 AceSearcher 的协同自我对弈
2025-09
·
16 分钟
·
7940 字
让流更短:CAR‑Flow 如何让生成模型停止原地打转
2025-09
·
13 分钟
·
6397 字
当预测调参对推断失效时:针对期望条件协方差的去偏与岭回归最优选择
2025-09
·
15 分钟
·
7188 字
进度条来拯救:微小信号如何帮助调度未知作业
2025-09
·
12 分钟
·
5513 字
LSD 与 LSD+:教快速采样器模仿慢而稳的采样器 — 关于离散扩散中可学习采样器蒸馏的温和导览
2025-09
·
11 分钟
·
5406 字
读完整个电影:功能缩放定律、内在时间,以及为什么 Warmup–Stable–Decay 有效
2025-09
·
17 分钟
·
8369 字
让 Do-SHAP 可用:估计量无关的因果解释与快速前缘技巧
2025-09
·
11 分钟
·
5135 字
DexFlyWheel — 将一次演示转化为成千上万类人类的灵巧机器人技能
2025-09
·
12 分钟
·
5938 字
EvoBrain:动态大脑网络如何帮助预测癫痫发作
2025-09
·
7 分钟
·
3382 字
HyPINO:训练一个神经算子,解决所有问题
2025-09
·
7 分钟
·
3462 字
从“整理”到3D场景:MesaTask如何教AI生成任务就绪的环境
2025-09
·
6 分钟
·
2844 字
WeSCon:教AI在句子中切换情感
2025-09
·
7 分钟
·
3170 字
初识 Orochi:驯服生物医学图像处理的多头蛇
2025-09
·
7 分钟
·
3388 字
超越删除:GeoRemover 如何擦除物体及其恼人的阴影
2025-09
·
6 分钟
·
2907 字
超越对角:利用结构化稀疏性释放状态空间模型的全部潜力
2025-09
·
8 分钟
·
3857 字
毒物如何传播:深入剖析大语言模型中的‘病毒感染攻击’
2025-09
·
6 分钟
·
2897 字
搭建通往更优设计的桥梁:ROOT 如何重新定义离线优化
2025-09
·
7 分钟
·
3137 字
从单个视频到 3D 动画木偶:深入解析 Stable Part Diffusion 4D
2025-09
·
7 分钟
·
3301 字
超越自回归:卷积与拒绝机制如何使扩散语言模型更快更流畅
2025-09
·
7 分钟
·
3086 字
GeoSVR:超越高斯溅射,以几何精确的稀疏体素重建表面
2025-09
·
6 分钟
·
3003 字
更少代价,更强隐私:草图如何在联邦学习中放大隐私保护
2025-09
·
9 分钟
·
4310 字
超越表达能力:衡量图神经网络威力的新方法
2025-09
·
8 分钟
·
3927 字
不错过任何一帧:深入解析 StreamForest 面向视频 AI 的事件记忆机制
2025-09
·
7 分钟
·
3136 字
D-Gating:让神经网络更小更快的可微技巧
2025-09
·
7 分钟
·
3059 字
超越利普希茨极限:非线性预处理如何帮助我们逃离鞍点
2025-09
·
7 分钟
·
3497 字
AI 自噬:为何生成模型正忘记如何创新
2025-09
·
6 分钟
·
2988 字
理解注意力机制:一个兼具速度与可解释性的新框架
2025-09
·
7 分钟
·
3135 字
超越冗余:InfMasking 如何教会 AI 理解协同作用
2025-09
·
7 分钟
·
3129 字
Mamba的盲点:为什么对称性是它的阿喀琉斯之踵
2025-09
·
8 分钟
·
4007 字
Mind the Glitch:AI 终于能够发现并修复生成图像中的不一致之处
2025-09
·
6 分钟
·
2832 字
为蛋白质设计提速:SpecMER 如何利用进化线索更快地生成更好的蛋白质
2025-09
·
7 分钟
·
3326 字
MAESTRO:指挥传感器数据的交响乐,即使乐器失声
2025-09
·
8 分钟
·
3624 字
超越COLMAP:ROS-Cam如何从日常视频中解锁4D场景
2025-09
·
7 分钟
·
3189 字
揭穿 AI 纹理偏见的神话:神经网络究竟如何看待世界
2025-09
·
8 分钟
·
3653 字
破解 GNN 黑箱:GNNXEMPLAR 如何用 AI 以通俗语言解释 AI
2025-09
·
7 分钟
·
3475 字
Transformer AI 的三幕剧:词元如何对齐、聚类与合并
2025-09
·
7 分钟
·
3124 字
重访平坦之地:在混合专家模型的损失地貌中寻找线性连接
2025-09
·
9 分钟
·
4485 字
超越人类反馈:基础模型如何通过 PRIMT 教会机器人
2025-09
·
7 分钟
·
3081 字
Dreamer 4:AI 如何通过做梦学会在《我的世界》中获得钻石
2025-09
·
8 分钟
·
3926 字
大语言模型能像我们一样持续学习吗?深入探讨情境持续学习
2025-09
·
7 分钟
·
3139 字
超越炒作:Kimi-Dev 如何连接人工智能软件工程的两个世界
2025-09
·
7 分钟
·
3121 字
超越 Hessian:深度学习中数据影响的贝叶斯视角
2025-09
·
8 分钟
·
3899 字
AI 智能体准备好迎接真实世界了吗?深入解析 MCPMark 基准测试
2025-09
·
9 分钟
·
4114 字
超越思维链:揭示大语言模型的静默推理
2025-09
·
10 分钟
·
4592 字
ChemMAS:教 AI 像化学家一样推理
2025-09
·
8 分钟
·
3546 字
演化反击:一种出乎意料且强大的 LLM 微调方法
2025-09
·
5 分钟
·
2196 字
龙之幼雏:连接 Transformer 与大脑的新型 AI 架构
2025-09
·
10 分钟
·
4691 字
背包 RL:训练更智能语言模型的一场计算“免费午餐”
2025-09
·
5 分钟
·
2370 字
超越数学谜题:教大语言模型“思考”如何释放卓越的聊天性能
2025-09
·
6 分钟
·
2748 字
初识 ARK-V1:一个能导航知识图谱以实现更智能问答的 LLM 代理
2025-09
·
6 分钟
·
2941 字
LLM能从计算机视觉中学到什么?LLM-JEPA简介
2025-09
·
6 分钟
·
2577 字
教语言模型三思而后行:深入解析 PDDL-INSTRUCT 框架
2025-09
·
5 分钟
·
2476 字
一个分词器统一所有?深入解析 ATOKEN 如何处理图像、视频和 3D
2025-09
·
6 分钟
·
2756 字
超越 ReAct 循环:使用 ARE 和 Gaia2 构建与测试更智能的 AI 智能体
2025-09
·
7 分钟
·
3149 字
AgentScaler:如何通过扩展环境(而非仅仅模型)来解锁高级 AI 智能体
2025-09
·
5 分钟
·
2163 字
抛开炒作:LLM 究竟是在学习还是在记忆?深入探讨上下文学习
2025-09
·
5 分钟
·
2477 字
GP-hy-T:通用物理引擎的黎明?
2025-09
·
6 分钟
·
2568 字
超越谷歌:DeepDive 如何教大语言模型成为专家级研究员
2025-09
·
6 分钟
·
2701 字
K2-THINK:320亿参数模型如何越级挑战AI巨头
2025-09
·
5 分钟
·
2301 字
在刀尖上平衡:人工智能如何发现流体动力学中难以捉摸的奇点
2025-09
·
7 分钟
·
3376 字
超越多数原则:训练大语言模型从多个猜测中综合出最佳答案
2025-09
·
6 分钟
·
2752 字
当多个 AI 大脑不如一个:AI 辩论的隐藏危险
2025-09
·
6 分钟
·
2762 字
打破大语言模型的“隧道视野”:深入解读 ParaThinker 的并行推理
2025-09
·
6 分钟
·
2938 字
实践出真知:AgentGym-RL 如何教大语言模型解决真实世界问题
2025-09
·
6 分钟
·
2809 字
超越“足够好”:ACE-RL 如何教大语言模型掌握长文本写作
2025-09
·
6 分钟
·
2726 字
REFRAG:为 RAG 超级加速,首个 token 生成速度提升 30 倍
2025-09
·
6 分钟
·
2545 字
大型语言模型如何学会思考——解析人工智能中的层次化推理
2025-09
·
5 分钟
·
2492 字
超越单尺度:解析 SINQ,实现更好、更快的大语言模型量化
2025-09
·
5 分钟
·
2461 字
超越聊天机器人:强化学习如何打造自主 AI 研究员
2025-09
·
6 分钟
·
2661 字
HuMo: 让文本、图像和语音完美协同的视频生成模型
2025-09
·
6 分钟
·
2853 字
小模型,大突破:VLA-Adapter 如何将机器人大脑缩小 14 倍
2025-09
·
4 分钟
·
1955 字
SAPO:群体智能训练——AI 模型如何通过经验共享加速 94% 学习
2025-09
·
6 分钟
·
2577 字
让AI像研究员一样浏览网页:打造超人类网络代理的两阶段方法
2025-09
·
5 分钟
·
2487 字
逆向推理:让小模型学会像作家一样思考
2025-09
·
6 分钟
·
2697 字
沉默的思考:大语言模型如何在内部进行推理
2025-09
·
7 分钟
·
3113 字
掌控 AI 研究助手:自定义模型与策略
2025-09
·
5 分钟
·
2340 字
Drivelology: 当 AI 遇上「深度废话」
2025-09
·
6 分钟
·
2711 字
UI-TARS-2: 通过强化学习训练AI掌控计算机的四大支柱
2025-09
·
5 分钟
·
2363 字
八月
23
DINOZAUR:一个更精简、更可靠的复杂物理神经算子
2025-08
·
6 分钟
·
2969 字
从静态网格到动态动画:深入解析Puppeteer
2025-08
·
8 分钟
·
3933 字
DeltaFlow:一种更智能、更快速的 3D 点云运动感知方法
2025-08
·
6 分钟
·
2669 字
用更少的数据玩转多目标——无标签数据如何驾驭复杂模型
2025-08
·
11 分钟
·
5293 字
你能预测未来吗?如果只能在周二尝试呢?
2025-08
·
8 分钟
·
3779 字
引导机器人重回正轨:深度解析潜在策略屏障
2025-08
·
8 分钟
·
3705 字
一个模型,多种任务:基于算子的 AI 如何同时实现图像修复、去噪和路径规划
2025-08
·
7 分钟
·
3420 字
解码复杂系统:一种用于发现因果循环与隐藏影响的新型人工智能框架
2025-08
·
7 分钟
·
3183 字
OpenCUA:构建能像你一样使用计算机的开源 AI 智能体
2025-08
·
8 分钟
·
3884 字
驯服混沌:信任域如何引导 AI 解决复杂问题
2025-08
·
9 分钟
·
4451 字
杀鸡焉用牛刀:为大语言模型设计智能、成本感知的路由
2025-08
·
8 分钟
·
3533 字
SmallKV:小小助手如何让大语言模型运行得更快、更轻巧
2025-08
·
6 分钟
·
2680 字
DINOZAUR:傅里叶神经算子的更精简、更确定的继任者
2025-08
·
7 分钟
·
3152 字
揭开对抗攻击的面纱:神经网络如何通过叠加态欺骗自己
2025-08
·
6 分钟
·
2996 字
Agent Lightning:训练任何 AI 代理所缺失的一环
2025-08
·
5 分钟
·
2215 字
GPU 的“奇点”已过:欢迎来到多任务时代
2025-08
·
7 分钟
·
3323 字
超越从左到右:介绍 Dream 7B,一款强大的新型扩散式大语言模型
2025-08
·
7 分钟
·
3164 字
WebWatcher:训练 AI 智能体像专业研究员一样看、读、推理
2025-08
·
4 分钟
·
1981 字
考验 AI 智能体:深入 LiveMCP-101 的真实世界挑战
2025-08
·
6 分钟
·
2877 字
PILOT:既会学习又省钱的智能大模型路由
2025-08
·
5 分钟
·
2472 字
搜索的数学极限:为什么完美的AI也无法检索一切
2025-08
·
6 分钟
·
2541 字
rStar2-Agent: 教会 AI 更聪明地思考,而非更冗长地推理
2025-08
·
5 分钟
·
2245 字
AI视觉模型如何学会像人类一样看世界:通往类脑智能的三把钥匙
2025-08
·
5 分钟
·
2180 字
七月
27
更大确实学得更好:规模如何解锁神经网络的组合泛化
2025-07
·
10 分钟
·
4671 字
从网格到力学:PhysX-3D 如何教会 3D 生成器关注物理
2025-07
·
13 分钟
·
6218 字
Talk2Event — 用事件的语言说话:在异步视觉中将自然语言落地
2025-07
·
14 分钟
·
6835 字
Segment Anything — 在开放世界中:OpenWorldSAM 如何为 SAM2 添加语言和实例感知
2025-07
·
13 分钟
·
6018 字
为什么 BFGS 真正有效:在无强凸性下的全局、仿射不变速率
2025-07
·
11 分钟
·
5396 字
当视觉-语言模型失去线索:探测非局部视觉推理
2025-07
·
12 分钟
·
5597 字
破解多语性诅咒:Meta CLIP 2 如何将 CLIP 扩展到全球网络
2025-07
·
10 分钟
·
4920 字
聆听、观察、移动:AI 如何学习从 3D 声音中生成人体运动
2025-07
·
8 分钟
·
3624 字
超越贪心搜索:释放 AI 研究智能体的力量
2025-07
·
7 分钟
·
3466 字
打破水印的权衡困境:深入解析 SEEK 如何实现强大的 LLM 保护
2025-07
·
7 分钟
·
3185 字
超越“好”与“坏”:清单如何教会大语言模型真正遵循指令
2025-07
·
7 分钟
·
3105 字
随流而动:构建理解运动的 RNN
2025-07
·
7 分钟
·
3163 字
更少数据,更多细节:CLiFT 如何革新神经渲染
2025-07
·
7 分钟
·
3237 字
超越对齐:SIU3R 如何统一三维场景重建与理解
2025-07
·
7 分钟
·
3043 字
初识 Audio Flamingo 3:一款前所未有的全开放人工智能,能听、会想、善聊
2025-07
·
9 分钟
·
4421 字
给 AI 踩刹车:如何控制推理模型的“思考速度”
2025-07
·
6 分钟
·
2643 字
我的模型学对了吗?介绍用于验证神经后验的 CoLT
2025-07
·
7 分钟
·
3264 字
自主掌控的协作式 AI:FLEXOLMO 简介
2025-07
·
7 分钟
·
3315 字
REG:让扩散 Transformer 训练速度提升 63 倍的简单技巧
2025-07
·
6 分钟
·
2587 字
FedCBDR:全局视角与智能缩放如何攻克联邦增量学习中的类别失衡问题
2025-07
·
6 分钟
·
2981 字
ElasticMM 如何大幅缩短 GPT‑4o 等视觉语言模型的等待时间
2025-07
·
7 分钟
·
3024 字
扩展记忆:为什么记忆马赛克 v2 在即时学习方面优于 Transformer
2025-07
·
8 分钟
·
3570 字
FlexOlmo:协作构建强大 AI——无需共享私有数据
2025-07
·
7 分钟
·
3300 字
释放 BFGS 的力量:无需常规假设的快速收敛
2025-07
·
7 分钟
·
3257 字
超越大数据:小而多样的数据集能教会 Transformer 更好地泛化吗?
2025-07
·
11 分钟
·
5368 字
想得越多,问题越多?当额外计算削弱大语言模型鲁棒性时
2025-07
·
7 分钟
·
3077 字
超越猜测:WebShaper 如何以数学精度打造更聪明的 AI 网络智能体
2025-07
·
5 分钟
·
2495 字
六月
96
为什么 ChebNet 值得重返舞台 —— 以及 Stable-ChebNet 如何修复其在长距离任务中的不稳定动力学
2025-06
·
15 分钟
·
7261 字
曲率来拯救:几何如何使高维下的激励探索高效
2025-06
·
13 分钟
·
6175 字
变分学习如何降低锐度:面向贝叶斯训练的稳定性边缘理论友好导览
2025-06
·
10 分钟
·
4990 字
如何以正确的方式增强二次规划:KKT 感知变换与对比预训练
2025-06
·
20 分钟
·
9933 字
教语言模型以3D思维:深入解析 ShapeLLM-Omni
2025-06
·
19 分钟
·
9108 字
G-Memory:教会多智能体团队记忆 — 深入解析用于大型语言模型代理的分层记忆
2025-06
·
23 分钟
·
11254 字
自我强迫视频扩散:教模型与自身错误共存
2025-06
·
15 分钟
·
7469 字
通过观察人类教机器人:面向对象的三维运动场详解
2025-06
·
14 分钟
·
6785 字
解开 Shampoo:为什么校正特征值 —— 而不总是特征基 —— 能修复它的启发式策略
2025-06
·
11 分钟
·
5261 字
让表格会说话:ConTextTab 如何将语义引入表格内上下文学习
2025-06
·
17 分钟
·
8176 字
Comba — 对双线性 RNN 闭环控制以实现快速且节省内存的序列建模
2025-06
·
17 分钟
·
8421 字
AsymGS — 双模型、更优 3D:使 3D Gaussian Splatting 对野外照片更稳健
2025-06
·
15 分钟
·
7229 字
驱赶百万高斯:最优传输如何在不破坏场景的情况下压缩 3D 高斯渲染
2025-06
·
15 分钟
·
7459 字
Uni-LoRA — 一个向量如何重构整个 LLM 的 LoRA
2025-06
·
21 分钟
·
10291 字
当视觉与运动共进化:SViMo 如何生成一致的手–物交互视频与 3D 运动
2025-06
·
10 分钟
·
4718 字
战胜长远博弈:如何通过缩短视窗解锁可扩展的离线强化学习
2025-06
·
11 分钟
·
5386 字
对冲胜者诅咒:防止推理时的奖励劫持
2025-06
·
11 分钟
·
5127 字
从标记到意图:ARIA 如何让强化学习适用于开放式语言动作
2025-06
·
10 分钟
·
4645 字
ALINE:一个学习提出聪明问题并即时更新信念的单一 Transformer
2025-06
·
11 分钟
·
5474 字
从嘈杂零件到组装形状 — 校正点流如何通过生成形状学习位姿
2025-06
·
16 分钟
·
7740 字
广泛思考,周密规划:MAoP 与 Travel‑Sim 如何教会 LLM 规划真实旅行
2025-06
·
13 分钟
·
6322 字
TimeWak — 在刻度上打水印:可追踪、鲁棒的合成时间序列水印
2025-06
·
12 分钟
·
5590 字
在每一个尺度“倾听”大脑:CSBrain 如何将跨尺度时空结构引入 EEG 基础模型
2025-06
·
16 分钟
·
7702 字
Transformer 如何通过借用技能来学习外推:长度泛化迁移解析
2025-06
·
14 分钟
·
6543 字
“约简映射”如何平整损失曲面 — 几何、曲率与更快收敛的温和导览
2025-06
·
11 分钟
·
5295 字
C-MICL:让学得的约束真正安全——面向优化的保形保证
2025-06
·
11 分钟
·
5083 字
当人们进步时:保守分类器如何在会改进的个体面前取胜
2025-06
·
12 分钟
·
5693 字
当记忆变得有创造力:基于 ReLU 的能量如何让联想记忆既能记住又能发明
2025-06
·
9 分钟
·
4054 字
即时修正预测:频谱校准与闪电更新如何让时空预测更稳健
2025-06
·
14 分钟
·
6693 字
BumbleBee:如何用一个大脑教会人形机器人跳舞、拳击和行走
2025-06
·
7 分钟
·
3473 字
更多动态,更少伪影:DenseDPO 如何革新 AI 视频生成
2025-06
·
6 分钟
·
2771 字
你能用迷你 Transformer 搭建一个巨型 Transformer 吗?
2025-06
·
7 分钟
·
3019 字
GNN 对链接的表达能力有多强?一个新框架、基准测试和一个出人意料的答案
2025-06
·
6 分钟
·
2902 字
AI 能设计出更好的 AI 吗?深入了解 Genesys——一个能发现新语言模型的 LLM
2025-06
·
10 分钟
·
4758 字
为什么大型 AI 模型在游戏中会失败:不稳定梯度的隐藏世界
2025-06
·
8 分钟
·
3521 字
我們能證明生成式模型不會抄襲嗎?版權保護的新視角
2025-06
·
8 分钟
·
3611 字
如何让 AI 彻底遗忘:蒸馏的力量
2025-06
·
6 分钟
·
2932 字
视频生成速度提升 5 倍:FPSAttention 如何解锁实时视频扩散
2025-06
·
5 分钟
·
2410 字
ReSim:在一个由安全专家与冒险新手构成的世界中训练自动驾驶汽车
2025-06
·
7 分钟
·
3423 字
认识 UMA:在近五亿个结构上训练的通用原子 AI 模型
2025-06
·
7 分钟
·
3141 字
AI 如何学习三维视觉:深入解析结构化提示与合成世界
2025-06
·
6 分钟
·
2898 字
因果推断自动驾驶:深入解析 CausalPFN
2025-06
·
11 分钟
·
5194 字
破解代码:如何在大型语言模型内部发现和引导概念
2025-06
·
8 分钟
·
3984 字
模型拼接:一种训练与理解语言模型的捷径
2025-06
·
7 分钟
·
3226 字
解锁双层优化:“集合光滑性”如何驯服非光滑问题
2025-06
·
7 分钟
·
3300 字
Transformer 能学会因果关系吗?深入解读 Do-PFN
2025-06
·
7 分钟
·
3266 字
ROBIN:借助扩散模型高飞,实现更快、更精确的物理模拟
2025-06
·
7 分钟
·
3073 字
坏数据也能出好模型:理解环境扩散
2025-06
·
7 分钟
·
3439 字
超越SMILES字符串:TRIDENT的三叉戟方法如何革新分子AI
2025-06
·
8 分钟
·
3674 字
超越 BEV:GaussianFusion 如何重塑自动驾驶的传感器融合
2025-06
·
7 分钟
·
3341 字
一个模型,统御万象:跨模型空间的摊销推断
2025-06
·
7 分钟
·
3474 字
驯服毒蛇 —— 随机性如何在机器学习中战胜目标性攻击
2025-06
·
8 分钟
·
3646 字
修正漂移:DNAEdit 如何实现高保真 AI 图像编辑
2025-06
·
6 分钟
·
2851 字
“分而治之”为何在多智能体 AI 中有效?秘密在于马尔可夫纠缠
2025-06
·
9 分钟
·
4111 字
训练稳定机器人:祖波夫定理如何解锁巨大的吸引域
2025-06
·
7 分钟
·
3392 字
当平坦性失效:解析高维空间中的神经破碎现象
2025-06
·
8 分钟
·
3815 字
超越平均值:在强化学习中评估回报分布的原则化指南
2025-06
·
7 分钟
·
3150 字
Mamba 与 ViT 的结合:折线路径掩码注意力的威力
2025-06
·
7 分钟
·
3082 字
从压缩到清晰:零样本去噪的突破
2025-06
·
7 分钟
·
3292 字
更聪明,而非更费力:无问题微调如何教会大语言模型自适应思考
2025-06
·
4 分钟
·
1578 字
UniSite:以更智能的方式发现结合口袋,革新药物研发
2025-06
·
7 分钟
·
3431 字
SignViP:一种用于生成超逼真手语视频的全新令牌语言
2025-06
·
6 分钟
·
2949 字
为什么你的谱 GNN 可能是盲目的——以及如何修复它
2025-06
·
7 分钟
·
3268 字
随 STARFlow 而动:归一化流会是图像生成的下一个爆点吗?
2025-06
·
7 分钟
·
3183 字
超越单一答案:ProtInvTree 如何利用智能搜索设计更好的蛋白质
2025-06
·
6 分钟
·
2994 字
Hour-LLaVA:教AI“刷剧”并理解长达一小时的视频
2025-06
·
7 分钟
·
3222 字
没有似然?没问题!用 Fisher 得分匹配直接估计梯度
2025-06
·
7 分钟
·
3361 字
利用自由解压缩窥探“不可触及”矩阵的内部
2025-06
·
8 分钟
·
3606 字
UniRelight:深入解析利用扩散模型联合分解与重现视频光照
2025-06
·
7 分钟
·
3209 字
接近未必够好——近似概率建模中的隐藏难题
2025-06
·
7 分钟
·
3198 字
AI 能在三维空间中观察和聆听吗?介绍 SAVVY,一种空间推理新方法
2025-06
·
7 分钟
·
3377 字
梯度的回响:通过打破时间反演对称性训练序列模型
2025-06
·
11 分钟
·
5020 字
另辟蹊径:状态熵如何让强化学习智能体更鲁棒
2025-06
·
7 分钟
·
3219 字
超越无记忆采样:深入解析伴随薛定谔桥采样器
2025-06
·
7 分钟
·
3120 字
MokA:为多模态世界重新思考 LoRA
2025-06
·
7 分钟
·
3007 字
揭穿噪声神话:生成式 AI 泛化学习的真正原理
2025-06
·
8 分钟
·
3937 字
GP-UCB 宝刀未老:为何这个经典的贝叶斯优化算法是近乎最优的
2025-06
·
6 分钟
·
2899 字
少即是多:自压缩网络如何学会忽略冗余层
2025-06
·
6 分钟
·
2803 字
超越像素:教 AI 像医生一样跨 X 射线、心电图和临床文本进行推理
2025-06
·
9 分钟
·
4215 字
超越每日平均:FuXi-Ocean 如何实现每六小时一次的海洋预报
2025-06
·
7 分钟
·
3269 字
统一物理与复杂性:统计学中计算难度的新视角
2025-06
·
8 分钟
·
3905 字
为什么你的 LLM“确定性”输出并非如此——以及如何解决
2025-06
·
8 分钟
·
3662 字
你能唯一地辨识一个神经网络吗?深入探索多项式网络
2025-06
·
7 分钟
·
3404 字
揭开 Transformer 损失景观的秘密
2025-06
·
7 分钟
·
3381 字
PlayerOne:将单张照片变为可交互的自我中心世界
2025-06
·
7 分钟
·
3201 字
架构手术:‘嫁接’技术如何让我们无需从零重训练即可重塑 AI 模型
2025-06
·
8 分钟
·
3552 字
解码黑箱:借助 EvoLM 深度剖析语言模型训练动态
2025-06
·
6 分钟
·
2802 字
为语言模型做 Boosting?别急:为什么组合生成器可能毁掉一切
2025-06
·
8 分钟
·
3681 字
VoxDet:将分割转化为检测,为 3D 场景理解带来“免费午餐”
2025-06
·
7 分钟
·
3084 字
随 STARFlow 而动:归一化流如何在图像生成领域摘星揽月
2025-06
·
2 分钟
·
844 字
重新思考排练:持续学习中何时序列式优于并发式
2025-06
·
9 分钟
·
4054 字
永不止步的学习——深入探索持续强化学习
2025-06
·
9 分钟
·
4495 字
基础模型困于往昔——持续学习能否使其与时俱进?
2025-06
·
7 分钟
·
3202 字
AI 研究助理到底有多强?深入了解 DeepResearch Bench 基准测试
2025-06
·
7 分钟
·
3179 字
教大语言模型如何自我教学:深入解读自适应语言模型(SEAL)
2025-06
·
7 分钟
·
3059 字
超越 Transformer:MesaNet 如何通过实时优化进行上下文学习
2025-06
·
10 分钟
·
4598 字
五月
135
Seeing Surgery in 3D: How OphNet-3D Reconstructs Hands and Tools for Microsurgical Analysis
2025-05
·
16 分钟
·
7844 字
FlashMD — 用长步幅推动分子动力学向前发展
2025-05
·
18 分钟
·
8596 字
从许多小程序构建世界模型:PoE‑World 如何在少量数据下学习预测与规划
2025-05
·
17 分钟
·
8224 字
教通用视觉-语言模型识别手写数学:深入 Uni‑MuMER
2025-05
·
12 分钟
·
5921 字
把跟踪器变成教师:SANSA 如何揭示 SAM2 内部的语义
2025-05
·
15 分钟
·
7402 字
UniVF 与 VF-Bench — 将时序一致性引入视频融合
2025-05
·
13 分钟
·
6323 字
R-AutoEval+:如何信任(并节省数据用于)像 LLM 裁判一样的自动评估器
2025-05
·
12 分钟
·
5916 字
Absolute Zero:教会语言模型学习——在没有任何数据的情况下
2025-05
·
17 分钟
·
8304 字
视觉-语言模型为何在空间任务上绊倒 —— 从认知视角看 VLM 失败(及简单修复)
2025-05
·
16 分钟
·
7581 字
从两种角度看世界:如何将自视和外视结合让视觉-语言模型更聪明
2025-05
·
16 分钟
·
7854 字
保持质量:用于强度守恒生成模型的离散空间扩散
2025-05
·
15 分钟
·
7395 字
将图像提升到球面:来自腕部相机的 SO(3)-等变视觉运动策略
2025-05
·
17 分钟
·
8293 字
当机器做科学:深入 AI-Researcher —— 端到端自主研究者
2025-05
·
13 分钟
·
6204 字
为什么随机积分器的选择决定深度 BSDE 求解器的成败
2025-05
·
13 分钟
·
6035 字
把模糊变成标尺:如何用散焦 + 预训练扩散先验零样本恢复度量深度
2025-05
·
15 分钟
·
7041 字
QHFLOW — 使用等变流匹配学习具对称性的 DFT 哈密顿量分布
2025-05
·
14 分钟
·
6758 字
如何欺骗 LLM 裁判:通过强化学习逆向工程人类偏好
2025-05
·
16 分钟
·
7516 字
为什么巨大学习率有时有效:受控发散、交叉熵与宽度缩放
2025-05
·
9 分钟
·
4436 字
非线性拉普拉斯 — 给 PCA 一个方向性推动以发现更弱信号
2025-05
·
12 分钟
·
5962 字
有用的捷径:选项感知值学习如何修复长时域离线目标强化学习
2025-05
·
10 分钟
·
4827 字
FlashIPA — 让几何感知注意力扩展到数千残基
2025-05
·
16 分钟
·
7665 字
更快迁移、更聪明定价:CM-TDP 如何让新市场向旧市场学习
2025-05
·
12 分钟
·
5551 字
Enigmata:教会 LLM 解谜的实用配方 — 可扩展的逻辑推理训练方案
2025-05
·
11 分钟
·
5021 字
当“更少的语言”更有用:将语言与推理解耦以构建更好的多语言大模型
2025-05
·
15 分钟
·
7193 字
2025-05
·
5 分钟
·
2092 字
可塑性与赋能 —— 信息理论下的主体能动性镜像
2025-05
·
11 分钟
·
5142 字
当模型知道自己正在被测试:探测并引导推理型大模型的“测试意识”
2025-05
·
11 分钟
·
5020 字
在教机器人执行动作时如何保持视觉-语言骨干不被破坏
2025-05
·
17 分钟
·
8103 字
当一个数字不够时:为什么有些决策需要词典序奖励
2025-05
·
10 分钟
·
4814 字
发现隐藏方向:多指标模型的稳健学习与 SQ 下界
2025-05
·
10 分钟
·
4858 字
别等到结尾:用时序一致性训练增量分类器
2025-05
·
8 分钟
·
3873 字
揭开无分类器引导的面纱:均值移动、对比主成分与 CFG 为什么有效
2025-05
·
12 分钟
·
5776 字
2025-05
·
13 分钟
·
6352 字
引导预训练预测器:从贝叶斯视角看提示微调及其局限
2025-05
·
2 分钟
·
562 字
RepoMaster — 教会代理读取、导航并复用 GitHub 仓库
2025-05
·
11 分钟
·
5109 字
CoRL:强化单一模型以精通视觉理解与生成
2025-05
·
12 分钟
·
5828 字
心智融合:InfiFPO 如何让模型通过偏好相互教学
2025-05
·
14 分钟
·
6778 字
如何学习真正鲁棒的半空间:逐步导读
2025-05
·
13 分钟
·
6252 字
教机器人你的洗衣流程:深入解析 DexGarmentLab
2025-05
·
7 分钟
·
3142 字
解锁亚二次方注意力:深入解读 MonarchAttention
2025-05
·
7 分钟
·
3420 字
寻找最佳平衡点:LLM 训练中临界批量大小的新视角
2025-05
·
7 分钟
·
3151 字
“等待”令牌技巧:通过激活控制唤醒语言模型的深层推理能力
2025-05
·
7 分钟
·
3062 字
解锁 2.3 倍速视频 AI:深入解析 Sparse VideoGen2 的语义感知注意力机制
2025-05
·
7 分钟
·
3013 字
超越平均:Best‑of‑K 强化学习如何解锁更难的问题
2025-05
·
7 分钟
·
3107 字
用图结构修复标签偏移:深入解析 GS-B³SE
2025-05
·
7 分钟
·
3082 字
修复视觉 Transformer:寄存器令牌如何清理混乱的特征
2025-05
·
6 分钟
·
2939 字
LoRAShop:您的 AI Photoshop,无需再训练即可组合和编辑概念
2025-05
·
7 分钟
·
3197 字
让小语言模型表现得像大模型:深入解析智能体蒸馏
2025-05
·
2 分钟
·
849 字
超越提示工程:RePS 如何实现对语言模型的精细控制
2025-05
·
7 分钟
·
3220 字
教 AI 探索:LLM 如何让强化学习更智能
2025-05
·
7 分钟
·
3127 字
DiCo:在扩散 Transformer 时代为卷积网络正名
2025-05
·
6 分钟
·
2833 字
重建 vs. 联合嵌入:深入探讨自监督学习领域的重大辩论
2025-05
·
7 分钟
·
3065 字
注意力就是你预测大脑活动所需要的一切
2025-05
·
8 分钟
·
3738 字
核岭回归的鲁棒性如何?深入探讨重尾噪声
2025-05
·
6 分钟
·
2876 字
预算有限的核方法:使用 Nyström 方法驯服协变量偏移
2025-05
·
6 分钟
·
2861 字
发现差异:子模与超模比率问题的统一视角
2025-05
·
8 分钟
·
3525 字
DeLTa:大语言模型如何在不接触你数据的情况下为决策树赋能
2025-05
·
7 分钟
·
3019 字
超越千亿:DeepSeek-V3 如何通过硬件感知设计重新定义大规模 AI
2025-05
·
7 分钟
·
3092 字
赋予 AI 空间感:深入解读 Spatial-MLLM
2025-05
·
7 分钟
·
3064 字
超越从左到右:FUDOKI 与多模态 AI 的未来
2025-05
·
7 分钟
·
3089 字
超越规模:基于梯度的数据多样性如何解锁下一代大语言模型的推理能力
2025-05
·
7 分钟
·
3125 字
FLAME:一步一步教大语言模型开出更安全的“鸡尾酒”处方
2025-05
·
7 分钟
·
3372 字
耳朵 vs. 眼睛:为什么人工智能难以定位声音——以及神经科学如何提供帮助
2025-05
·
8 分钟
·
3611 字
超越单一分数:ARECHO 如何建模复杂的语音质量网络
2025-05
·
9 分钟
·
4400 字
思想链(CoT)为何有效?一项新理论揭示其奥秘
2025-05
·
6 分钟
·
2580 字
PRODVA:一种乐高式的蛋白质功能设计方法
2025-05
·
7 分钟
·
3207 字
信息在传输中丢失:解构大语言模型中的通信瓶颈
2025-05
·
8 分钟
·
3753 字
Transformer Copilot:教大语言模型从自身错误中学习
2025-05
·
9 分钟
·
4508 字
更智能,而非更大:B3 如何通过智能批次构建革新对比学习
2025-05
·
7 分钟
·
3232 字
克隆巨头:低秩克隆如何让小型语言模型的训练速度提升 1000 倍
2025-05
·
6 分钟
·
3002 字
超越4K:GeoLLaVA-8K如何教AI以超高清分辨率从太空看地球
2025-05
·
7 分钟
·
3489 字
告别步数统计:让“达到目标时间”可微,实现更快优化
2025-05
·
7 分钟
·
3234 字
超越最坏情况:离散分布的实例最优私有估计
2025-05
·
9 分钟
·
4442 字
教 AI 编写 DNA:约束强化学习如何设计细胞类型特异性基因开关
2025-05
·
7 分钟
·
3144 字
SageAttention3:利用 FP4 实现 5 倍速注意力,并深入探讨 8 位训练
2025-05
·
7 分钟
·
3017 字
LODGE:用智能高斯泼溅技术将宏大的 3D 世界带到你的手机上
2025-05
·
7 分钟
·
3112 字
为何有些 AI 模型能够扩展?深入探讨尺寸泛化理论
2025-05
·
10 分钟
·
5004 字
超越状态空间模型:结构化线性受控微分方程 (SLiCEs) 如何兼具速度与表达能力
2025-05
·
7 分钟
·
3449 字
引导 AI 畅游互联网:深入解析 WEB-SHEPHERD
2025-05
·
4 分钟
·
1846 字
快赢或慢输:为什么你的 LLM 智能体需要快速思考
2025-05
·
6 分钟
·
2853 字
惊人的协同效应:为什么稀疏MoE模型偏爱推测解码
2025-05
·
7 分钟
·
3342 字
一条适用于机器学习泛化的热力学定律
2025-05
·
8 分钟
·
3620 字
AirRep:在 AI 数据归因中弥合速度与准确性之间的鸿沟
2025-05
·
6 分钟
·
2957 字
驯服噪声猛兽:迭代式过滤如何征服受污染的数据集
2025-05
·
7 分钟
·
3382 字
超越“多少”:用扩散模型揭示神经元编码的
内容
2025-05
·
8 分钟
·
3625 字
揭秘 CEI:深入理解其收敛速率
2025-05
·
7 分钟
·
3111 字
超越简单的谷歌搜索:DeepDiver 如何教 LLM 成为专家级研究员
2025-05
·
7 分钟
·
3398 字
多亏了隐藏的偏见,AI 伪造图像检测技术迎来重大升级
2025-05
·
6 分钟
·
2716 字
拼接未来:扩散模型如何解决强化学习中的一个关键挑战
2025-05
·
7 分钟
·
3450 字
打破权衡:兼具快速学习保证的平滑凸损失函数
2025-05
·
7 分钟
·
3344 字
OmniSync:借助扩散 Transformer,为任意视频开启唇形同步新纪元
2025-05
·
6 分钟
·
2949 字
蝙蝠侠也需要罗宾:小小的“AI搭档”如何增强你巨型模型的置信度
2025-05
·
7 分钟
·
3130 字
超越瓶颈:GraLoRA 如何解锁更高秩的微调
2025-05
·
7 分钟
·
3063 字
当数据说谎时:理解 COMPFLOW——在多变世界中训练强化学习的更智能方法
2025-05
·
7 分钟
·
3124 字
条条大路通罗马:利用多样性感知的强化学习提升大语言模型的数学能力
2025-05
·
7 分钟
·
3033 字
D.Va:让机器人学会“看见”与“行动”的捷径——训练时间从数周缩短至数小时
2025-05
·
8 分钟
·
3659 字
SpecEdge:结合云服务器与边缘 GPU,大幅削减 LLM 成本
2025-05
·
7 分钟
·
3043 字
为 AI 临床医生设置“护栏”:深入探讨医疗保健中的安全强化学习
2025-05
·
7 分钟
·
3386 字
超越多数投票:深入解析 CaMVo,打造高性价比的 LLM 标注方案
2025-05
·
7 分钟
·
3226 字
AuroRA:以 8 倍更少的参数实现 LoRA 的 SOTA 性能
2025-05
·
6 分钟
·
2821 字
UMoE:打造更智能、稀疏激活 Transformer 的统一方案
2025-05
·
6 分钟
·
2989 字
InForage:让大语言模型像人类一样搜寻信息
2025-05
·
7 分钟
·
3238 字
超越网格:CALM-PDE 如何利用自适应卷积求解复杂物理问题
2025-05
·
7 分钟
·
3296 字
强化学习能教会大语言模型像医生一样思考吗?深入解析 DRG‑SAPPHIRE
2025-05
·
7 分钟
·
3269 字
该看哪里:PhySense 如何教会 AI 为物理传感器找到最佳位置
2025-05
·
7 分钟
·
3107 字
MeanFlow:单步生成高保真图像
2025-05
·
6 分钟
·
2645 字
解构经验回放:数据归因如何让强化学习更具可解释性和效率
2025-05
·
7 分钟
·
3258 字
超越扁平视频:Dynam3D 如何赋予导航 AI 真正的 3D 空间感
2025-05
·
7 分钟
·
3069 字
破解触觉密码:AI 模型如何学习像啮齿动物一样“感知”
2025-05
·
8 分钟
·
3568 字
智能的几何学:叠加态如何解释大语言模型为何越大越好
2025-05
·
6 分钟
·
2999 字
破解涌现之谜:稀疏注意力与数据重复如何塑造大语言模型的学习
2025-05
·
7 分钟
·
3483 字
超越负载均衡:构建更智能混合专家模型的新方案
2025-05
·
7 分钟
·
3079 字
一次训练,随处运行:深入解析通用车辆轨迹学习模型 TransferTraj
2025-05
·
7 分钟
·
3337 字
超越准确性:一种用于校准高维预测的通用算法
2025-05
·
7 分钟
·
3361 字
陷入瓶颈?几秒钟的“思考”如何彻底改变你的强化学习智能体性能
2025-05
·
6 分钟
·
2663 字
从刚性规则到灵活学习:一种更智能的等变网络训练方法
2025-05
·
6 分钟
·
3005 字
解压 KVzip:如何在不丢失上下文的情况下让大语言模型更快、更轻
2025-05
·
7 分钟
·
3220 字
Adam 的成功秘诀是什么?深入剖析优化器之王
2025-05
·
7 分钟
·
3337 字
通往更智能 LLM 的大门:一个简单技巧如何增强注意力并消除沉溺现象
2025-05
·
6 分钟
·
2808 字
OpenHOI:通过对话,教会AI与任何物体交互
2025-05
·
7 分钟
·
3072 字
OmniSync:开启任意视频(真实或 AI 生成)唇形同步的新纪元
2025-05
·
9 分钟
·
4019 字
LLM 真的智能吗?KORGym 用 50 多款游戏检验其推理能力
2025-05
·
7 分钟
·
3237 字
一次修复一个面:深入解析 Mesh-RFT
2025-05
·
7 分钟
·
3100 字
一个算法统领全局?图与集合优化的统一视角
2025-05
·
8 分钟
·
3872 字
两全其美:知识绝缘如何让机器人更快、更智能
2025-05
·
6 分钟
·
2905 字
BIOREASON:融合 DNA 和语言模型,教 AI 像生物学家一样思考
2025-05
·
7 分钟
·
3432 字
超越静态帧:深入解析 UniVF 实现无闪烁视频融合
2025-05
·
7 分钟
·
3151 字
当场抓获:我们能通过观察 AI 的“思维过程”来识破其欺骗行为吗?
2025-05
·
8 分钟
·
3528 字
解决AI的“失忆症”:超网络与原型如何战胜灾难性遗忘
2025-05
·
6 分钟
·
2865 字
永不遗忘:让 AI 持续学习的可扩展技巧
2025-05
·
7 分钟
·
3081 字
少即是多:通过增强大语言模型的自信来解锁其推理能力
2025-05
·
6 分钟
·
2828 字
循序渐进学逻辑:课程溯因学习如何稳定AI推理
2025-05
·
7 分钟
·
3377 字
Prism:通过更智能的 GPU 共享,大幅削减 LLM 服务成本
2025-05
·
8 分钟
·
3528 字
即时训练:LLM 如何在测试中持续自我提升
2025-05
·
7 分钟
·
3057 字
LaCT:为什么对于测试时训练和长上下文AI,越大越好
2025-05
·
8 分钟
·
3671 字
四月
28
不教答案也能教会推理:EMPO 如何在无监督下让 LLM 进行推理
2025-04
·
12 分钟
·
5697 字
ReDi:教会扩散模型用特征思考 —— 更快、更智能的图像生成
2025-04
·
11 分钟
·
5243 字
GraphMaster:协调 LLM 代理以合成带文本属性的图
2025-04
·
4 分钟
·
1794 字
可疑的机器人:《Among Us》如何揭示 AI 的欺骗行为
2025-04
·
7 分钟
·
3504 字
Taccel:一款 GPU 加速模拟器,可同时为数千个虚拟机器人带来逼真的触感
2025-04
·
7 分钟
·
3141 字
少即是多:MCTS 引导的数据筛选,解锁视觉语言模型的 SoTA 性能
2025-04
·
7 分钟
·
3207 字
治愈 AI 的“过度思考”:FAST-GRPO 如何教视觉模型快思慢想
2025-04
·
7 分钟
·
3017 字
FramePack:斯坦福与麻省理工学院如何解决 AI 视频生成中的遗忘与漂移问题
2025-04
·
7 分钟
·
3133 字
超越反向传播:去相关误差如何训练神经网络
2025-04
·
8 分钟
·
3842 字
从混沌到相干:扩散模型如何学会绘画
2025-04
·
7 分钟
·
3476 字
揭秘缩放定律:大语言模型如何通过压缩语言进行学习
2025-04
·
10 分钟
·
4567 字
教扩散模型学会推理:深入解读 d1 框架
2025-04
·
3 分钟
·
1454 字
超越复制粘贴:MIGGPT 如何教会大语言模型迁移复杂的内核补丁
2025-04
·
7 分钟
·
3384 字
超越黑盒:PerceptionLM 如何让 AI 视觉研究开放且可复现
2025-04
·
8 分钟
·
3829 字
教会 AI 进行双重检查:VL-Rethinker 如何利用强化学习提升多模态推理能力
2025-04
·
7 分钟
·
3261 字
杂乱数据的惊人优势:深入探究多模态错位
2025-04
·
8 分钟
·
3768 字
寻找万能钥匙:微小子网络如何驱动语言模型预测
2025-04
·
7 分钟
·
3128 字
超越 Softmax:量子电路如何稳定并增强 Transformer 注意力机制
2025-04
·
7 分钟
·
3331 字
解锁隐藏层:感知编码器如何重新定义视觉技术新境界
2025-04
·
11 分钟
·
5393 字
为混乱的离线强化学习理清头绪
2025-04
·
8 分钟
·
3519 字
强化学习让大语言模型更好,但不更聪明:探索人工智能自我提升的极限
2025-04
·
7 分钟
·
3181 字
超越黑盒:PerceptionLM 如何为视觉 AI 构建透明的未来
2025-04
·
9 分钟
·
4089 字
FM-LoRA:让 AI 终身学习而不遗忘
2025-04
·
6 分钟
·
2945 字
即时学习:深入解析神经场的元持续学习
2025-04
·
6 分钟
·
2865 字
超越上下文窗口:MemO 如何赋予 AI 持久记忆
2025-04
·
6 分钟
·
2705 字
BitNet b1.58:重新定义 AI 效率的 1 比特大语言模型
2025-04
·
7 分钟
·
3277 字
Agent S2:AI 专家团队如何掌控你的电脑
2025-04
·
6 分钟
·
2630 字
CoProSketch: 终于有了可以编辑的AI草图生成器
2025-04
·
5 分钟
·
2405 字
三月
29
DeCaFlow — 使用因果正规化流去混淆:一个模型回答多种因果问题
2025-03
·
10 分钟
·
4748 字
从 (ε, δ) 到 ε:随机后处理如何净化差分隐私
2025-03
·
14 分钟
·
6896 字
Opt-CWM:学会向视频预测器提出更好的问题以提取运动
2025-03
·
11 分钟
·
5137 字
2025-03
·
10 分钟
·
4974 字
三方拉锯战:掌握神经压缩中的码率、失真与感知
2025-03
·
6 分钟
·
2981 字
过度思考的 AI:当“思考”损害模型性能时
2025-03
·
9 分钟
·
4290 字
LLM 的平行世界:探索 FFN 融合与模型效率的未来
2025-03
·
6 分钟
·
2962 字
DiLoCo 的扩展秘密:在无通信瓶颈下训练超大规模语言模型
2025-03
·
7 分钟
·
3298 字
自教式前瞻:LLM 如何在无奖励的情况下更聪明地规划
2025-03
·
7 分钟
·
3507 字
CompDiffuser:通过拼接短期技能教机器人进行长期规划
2025-03
·
7 分钟
·
3134 字
打破对称性,优化化学:深入解析 ELECTRA
2025-03
·
7 分钟
·
3429 字
超越对角:不动点迭代如何解锁稠密 RNN
2025-03
·
8 分钟
·
3571 字
这个 AI 会推理吗?理解神经符号学习的新理论
2025-03
·
7 分钟
·
3244 字
超越评分:Q-Insight 如何教 AI 像摄影师一样“看”
2025-03
·
6 分钟
·
2618 字
更智能,而非更费力:自截断技术如何让大语言模型推理效率提升80%
2025-03
·
8 分钟
·
3774 字
UFO 是真的:语言模型如何学会观察、检测和分割我们的世界
2025-03
·
7 分钟
·
3368 字
超越精美画面:WISA 如何教 AI 学习物理定律
2025-03
·
7 分钟
·
3040 字
Q-FAT:一种无需量化的 Transformer,实现更平滑、更智能的机器人模仿学习
2025-03
·
6 分钟
·
2761 字
扩展强化学习:深度如何释放涌现行为
2025-03
·
7 分钟
·
3042 字
Pan-LUT:利用可学习查找表实现闪电般快速的卫星图像锐化
2025-03
·
6 分钟
·
2752 字
超越对角 RNN:不动点迭代如何释放新的表达能力
2025-03
·
6 分钟
·
2994 字
超越CNN:利用Pan-LUT实现闪电般快速的卫星图像融合
2025-03
·
6 分钟
·
2916 字
聚焦无解之境:如何在联邦学习中实现完美收敛
2025-03
·
7 分钟
·
3251 字
低成本对抗 AI 遗忘症:Replay4NCL 如何实现高效终身学习
2025-03
·
7 分钟
·
3233 字
“顿悟”时刻:揭开大型语言模型(LLM)神秘的涌现能力
2025-03
·
8 分钟
·
3946 字
破解密码:神经网络如何将可解释特征藏于显眼之处
2025-03
·
7 分钟
·
3337 字
DAPO:揭秘强化学习,打造超人级大语言模型推理能力
2025-03
·
6 分钟
·
2983 字
弥合差距:RISE 如何应对基于模拟的推断中的缺失数据
2025-03
·
7 分钟
·
3043 字
按需生成 AI 大脑:ORAL 如何为不断演进的 LLM 打造 LoRA 适配器
2025-03
·
6 分钟
·
2930 字
二月
52
平衡过去:如何用差异理论压缩长上下文 Transformer 的 KV 缓存
2025-02
·
13 分钟
·
6461 字
AutoToM:让模型去构建模型 —— 可扩展的自动贝叶斯心智理论
2025-02
·
14 分钟
·
6952 字
培育更安全的智能体:AgentBreeder 如何演化多智能体脚手架以提升能力与安全性
2025-02
·
13 分钟
·
6464 字
教机器人重要的方向:语义方向与 SOFAR 系统
2025-02
·
16 分钟
·
7698 字
边玩边学:乐观镜像下降如何让大语言模型更符合人类偏好
2025-02
·
14 分钟
·
6637 字
当标签在说谎 —— SCAM 如何用自监督重新训练时间序列预测
2025-02
·
15 分钟
·
7400 字
KARMA:多智能体大型语言模型如何将科学论文转化为知识图谱
2025-02
·
14 分钟
·
6763 字
DICEPTION — 将文本到图像扩散模型转变为一个覆盖多种感知任务的单一模型
2025-02
·
21 分钟
·
10104 字
从仓库到运行:Repo2Run 如何用 LLM 代理自动化 Docker 环境
2025-02
·
10 分钟
·
4529 字
UniTok — 如何打造一个既能“看”又能“创”的视觉分词器
2025-02
·
12 分钟
·
5830 字
在大规模下驯服异质性:用于弱耦合 MDP 的基于投影的 Lyapunov 方法
2025-02
·
11 分钟
·
5217 字
为什么你的优化器会选择一个间隔:谱下降、Muon 与多类线性分类器的几何学
2025-02
·
11 分钟
·
5422 字
像人一样阅读:VIST 如何教大语言模型略读长文本
2025-02
·
7 分钟
·
3083 字
超越同量测度:一种可扩展的图上非均衡数据比较新方法
2025-02
·
6 分钟
·
2872 字
Twilight:以自适应稀疏性突破大语言模型推理的固定预算限制
2025-02
·
7 分钟
·
3079 字
一个模型即可统领一切:RobustMerge 如何融合专业化 AI 大脑
2025-02
·
7 分钟
·
3154 字
不只是画得好看:在稳定扩散模型中实施硬约束
2025-02
·
7 分钟
·
3399 字
角度校准:一种可被证明最优的高维分类器校准方法
2025-02
·
7 分钟
·
3301 字
在潜在空间中思考:循环式 LLM 如何学会深度推理
2025-02
·
7 分钟
·
3302 字
超越二次复杂度:解析 MoBA,实现超高效长上下文大语言模型
2025-02
·
6 分钟
·
2927 字
少即是多:用智能数据选择加速 LLM 对齐
2025-02
·
6 分钟
·
2898 字
两全其美:一种用于隐私机器学习的新采样方法
2025-02
·
6 分钟
·
2976 字
超越欧几里得空间:生成式 AI 如何通过李群扩散学习对称性
2025-02
·
6 分钟
·
2796 字
超越平均值:复杂金融与科学模型的量子飞跃
2025-02
·
7 分钟
·
3229 字
BevSplat:用 3D 高斯“绘画”从太空精准定位你的位置
2025-02
·
7 分钟
·
3172 字
KL 校准:通往可靠在线预测的更强路径
2025-02
·
6 分钟
·
2917 字
GSRF:溅射无线电波,实现超快速无线仿真
2025-02
·
7 分钟
·
3082 字
超越稳定性边缘:为何任意步长都适用于梯度下降
2025-02
·
8 分钟
·
3698 字
核周采样(Perinucleus Sampling):在不损害模型的前提下向 LLM 嵌入超过 24,000 个指纹
2025-02
·
7 分钟
·
3286 字
超越直觉:双心智 AI 如何学习用逻辑预测未来
2025-02
·
7 分钟
·
3021 字
对称博弈与最小最大优化中隐藏的复杂性
2025-02
·
7 分钟
·
3291 字
如何利用反事实解释窃取 AI 模型
2025-02
·
7 分钟
·
3117 字
微调不可知学习:深入探究近乎最优的分类
2025-02
·
8 分钟
·
3515 字
GRAPE:通过寻找最匹配的数据,从大语言模型中榨取更多性能
2025-02
·
6 分钟
·
2621 字
征服魔方:人工智能如何打破巨型 5×5×5 魔方谜题的记录
2025-02
·
7 分钟
·
3227 字
标签平滑的隐藏缺陷——MaxSup 来修复
2025-02
·
6 分钟
·
2784 字
为什么模拟 AI 训练会出错:理解并修复非理想阻性器件
2025-02
·
8 分钟
·
3824 字
超越下一个词元预测:挑战大语言模型范式的扩散模型 LLaDA
2025-02
·
6 分钟
·
2968 字
神经网络训练的三个时代:学习、过拟合与遗忘
2025-02
·
9 分钟
·
4435 字
找到正确的角度:一种在高维空间中实现完美校准模型的新方法
2025-02
·
7 分钟
·
3370 字
一个 LoRA 能否统领全局?C-LoRA 终身学习方法介绍
2025-02
·
6 分钟
·
2963 字
超越记忆:Minnow 如何让语言模型即时掌握新词
2025-02
·
9 分钟
·
4493 字
AnyMDP 与 OmniRL:构建能在随机世界中即时学习的 AI 智能体
2025-02
·
7 分钟
·
3336 字
Optimus-2:让 AI 像专家一样玩转 Minecraft 的更智能策略
2025-02
·
7 分钟
·
3319 字
IndexTTS:深入解读 Bilibili 的工业级可控声音克隆系统
2025-02
·
7 分钟
·
3100 字
让大语言模型真正遗忘:更平滑的路径如何化解“失忆恢复”攻击
2025-02
·
7 分钟
·
3369 字
数据策展的艺术:深入探索最先进的小型语言模型 SmolLM2
2025-02
·
8 分钟
·
3774 字
为什么你的可解释 AI 可能在欺骗你:深入剖析联合推理捷径
2025-02
·
8 分钟
·
3659 字
超越 AdamW:Muon 优化器如何让大语言模型训练速度提升两倍
2025-02
·
7 分钟
·
3224 字
别再重复犯错:LLM 如何实时从反馈中学习
2025-02
·
6 分钟
·
2885 字
超越训练循环:用推理时技巧解锁 LLM 的推理能力
2025-02
·
6 分钟
·
2994 字
YOLOv12: 打破CNN垄断的注意力机制实时检测器
2025-02
·
6 分钟
·
2699 字
一月
15
超越记忆:DeepSeek-R1 如何教会大语言模型真正地推理
2025-01
·
7 分钟
·
3058 字
2025-01
·
14 分钟
·
6912 字
Wigner 6j 重新耦合如何让等变 Transformer 可扩展:友好的 E2Former 深入解析
2025-01
·
13 分钟
·
6502 字
谨慎花费:为什么你的合成数据集应呈指数增长
2025-01
·
11 分钟
·
5093 字
数据的双螺旋:联合学习样本与特征的层次结构
2025-01
·
9 分钟
·
4394 字
超越高斯过程:用算子流匹配学习任意函数分布
2025-01
·
7 分钟
·
3129 字
脉冲、位置与 Transformer——类脑人工智能中的相对编码新思路
2025-01
·
7 分钟
·
3371 字
超越点积:用张量积注意力压缩大语言模型的内存
2025-01
·
8 分钟
·
3666 字
解读 VITA-1.5:开源社区对实时 AI 视觉与语音的探索
2025-01
·
6 分钟
·
2950 字
SD-LoRA:基础模型如何实现无遗忘的持续学习
2025-01
·
7 分钟
·
3058 字
遇见 Titans:一种能在运行时学习记忆的新型 AI
2025-01
·
7 分钟
·
3383 字
超越金鱼记忆:Zep 的时序知识图谱如何赋予 AI 更智能的大脑
2025-01
·
7 分钟
·
3463 字
为什么你的猫仍然比最先进的人工智能更聪明
2025-01
·
7 分钟
·
3432 字
超越黑箱:深入探索自可解释神经网络
2025-01
·
11 分钟
·
5256 字
超越预训练:大语言模型如何即时重构其‘大脑’
2025-01
·
7 分钟
·
3237 字
2024
120
十二月
12
Mulberry 与 CoMCTS —— 教会多模态大模型协同思考、智能搜索与反思
2024-12
·
16 分钟
·
7736 字
教会 2D 模型理解 3D:一种全新的分子交互预训练策略
2024-12
·
8 分钟
·
3640 字
AlphaZero、齐夫定律与惊人的频率力量
2024-12
·
7 分钟
·
3435 字
驯服蜂群——子采样如何解锁可扩展的多智能体 AI
2024-12
·
10 分钟
·
4635 字
预测未来:TREND 如何让自动驾驶汽车实现四维感知
2024-12
·
6 分钟
·
2837 字
当算法变得不稳定:深入解析 UCB-V 老虎机算法
2024-12
·
7 分钟
·
3068 字
S2P2:重新定义事件序列预测的深度状态空间模型
2024-12
·
7 分钟
·
3311 字
超越固定架构:AI 模型如何通过成长实现终身学习
2024-12
·
7 分钟
·
3304 字
超越小样本:解构语境学习的全貌
2024-12
·
8 分钟
·
3550 字
AI、大脑模型与混乱数据:构建鲁棒的摊销贝叶斯推断
2024-12
·
8 分钟
·
3767 字
TRELLIS:用统一的隐空间结构编织高质量 3D 世界
2024-12
·
6 分钟
·
2530 字
从未见过画作的AI,如何学会艺术创作?
2024-12
·
6 分钟
·
2915 字
十一月
12
当模态竞争:博弈论与互信息如何拯救多模态学习
2024-11
·
11 分钟
·
5397 字
EigenPro 4:用于快速大规模核学习的延迟投影
2024-11
·
13 分钟
·
6321 字
深入机器之心:揭示 LLM 中的推理电路
2024-11
·
7 分钟
·
3189 字
教神经网络思考:潜在程序搜索的力量
2024-11
·
7 分钟
·
3048 字
超越 MAML:一种利用核与梯度协调的更快、更智能的学会学习之道
2024-11
·
7 分钟
·
3086 字
即时学习:深入解析用于持续学习的 Online-LoRA
2024-11
·
8 分钟
·
3509 字
DualLoRA:教视觉 Transformer 新技巧,同时不忘旧知识
2024-11
·
6 分钟
·
2916 字
当模型遇见现实:测试时自适应终极指南
2024-11
·
10 分钟
·
4739 字
训练大语言模型成为自己最严厉的批判者
2024-11
·
8 分钟
·
3770 字
超越提示:揭示大型语言模型中的捷径学习
2024-11
·
7 分钟
·
3354 字
A-BLINK:使用神经网络为高斯过程推理提速
2024-11
·
7 分钟
·
3012 字
为什么 AI 不像我们一样“懂”:对齐人类与机器的泛化方式
2024-11
·
7 分钟
·
3338 字
十月
20
超越平面国:为什么双曲几何是 LLM 推理的下一个前沿
2024-10
·
6 分钟
·
2883 字
超越均值:一种性能接近最优的不宁腿老虎机新策略
2024-10
·
8 分钟
·
4006 字
教语言模型开车:PLMTrajRec 如何填补 GPS 数据的空白
2024-10
·
7 分钟
·
3291 字
一个任务,多种解法——神经网络如何揭示智能背后隐藏的多样性
2024-10
·
8 分钟
·
3540 字
SSM 的隐藏漏洞:干净数据如何破坏 Mamba、S4 及其同类模型
2024-10
·
9 分钟
·
4208 字
教 AI 像人一样学习:深入解析对比元学习(ConML)
2024-10
·
7 分钟
·
3313 字
Transformer 是可学习的:一种用于线性注意力的多项式时间算法
2024-10
·
6 分钟
·
2887 字
Transformer 可被证明高效学习——至少某些类型可以
2024-10
·
7 分钟
·
3183 字
翻转难题:当对称性成为障碍时,如何确定 3D 模型的朝向
2024-10
·
6 分钟
·
2854 字
超越‘即训即测’:对比学习如何为元学习器赋能
2024-10
·
6 分钟
·
2882 字
超越回合制:OmniFlatten 如何教 AI 进行自然、可被打断的语音对话
2024-10
·
7 分钟
·
3058 字
AI 能看见显而易见的事物吗?为何顶级视觉模型也会在简单推理上失败
2024-10
·
7 分钟
·
3117 字
揭秘扩散模型加速的秘密:AdaptiveDiffusion 如何智能地跳过步骤
2024-10
·
6 分钟
·
2681 字
驯服两大“对手”:鲁棒稀疏回归的突破性进展
2024-10
·
8 分钟
·
3848 字
用随机数据解锁上下文强化学习——深入解析状态-动作蒸馏(SAD)
2024-10
·
7 分钟
·
3255 字
AlphaGateau:利用图表示,更快、更智能地训练国际象棋引擎
2024-10
·
7 分钟
·
3230 字
LLM 如何自我学习,变得更值得信赖
2024-10
·
6 分钟
·
2915 字
ACE:一个统一视觉、优化和科学模拟的 Transformer 模型
2024-10
·
7 分钟
·
3182 字
FLASHMASK:用超高效注意力掩码驾驭长序列
2024-10
·
6 分钟
·
2637 字
可视化故事写作:通过操作交互式故事地图来编辑叙事
2024-10
·
6 分钟
·
2652 字
九月
7
2024-09
·
14 分钟
·
6636 字
HM3:通过强化学习与多目标优化重塑模型合并
2024-09
·
7 分钟
·
3171 字
寻找公平性前沿:无需训练复杂模型即可计算最优权衡
2024-09
·
6 分钟
·
2883 字
AI 可解释性中的隐藏弱点:当特征相互“吸收”时
2024-09
·
8 分钟
·
3823 字
学会关联:任务相似性如何解决元学习的欠拟合问题
2024-09
·
8 分钟
·
3782 字
叠加之困:一个神经元究竟能计算多少个特征?
2024-09
·
7 分钟
·
3079 字
超越静态模型:TTT-UNet如何即时自适应以实现卓越的医学图像分割
2024-09
·
7 分钟
·
3027 字
八月
2
滤除噪声:深入探究用于小样本学习的特征对齐技术
2024-08
·
6 分钟
·
2663 字
超越存储:解析叠加态计算背后的数学原理
2024-08
·
7 分钟
·
3291 字
七月
12
学会学习:深入探索元学习与表示学习的理论基础
2024-07
·
7 分钟
·
3010 字
训练不可训练的模型:JumpReLU 如何在语言模型中解锁更优特征
2024-07
·
7 分钟
·
3047 字
破解黑箱:Transformer 可解释性机理实用指南
2024-07
·
11 分钟
·
5227 字
永不遗忘:MAGMAX 和模型合并如何革新持续学习
2024-07
·
7 分钟
·
3180 字
C-ADA:一种更快、更智能且不会遗忘的人工智能学习方式
2024-07
·
7 分钟
·
3104 字
超越钻石:ODYSSEY 如何训练 AI 掌握《我的世界》开放世界
2024-07
·
8 分钟
·
3650 字
RNN 回归?让隐藏状态成为学习器,解锁长上下文潜力
2024-07
·
7 分钟
·
3348 字
自我意识悖论:教神经网络自我建模如何使其变得更简单
2024-07
·
7 分钟
·
3050 字
Train-Attention:教会大语言模型在持续学习中关注关键信息
2024-07
·
3 分钟
·
1233 字
Longhorn:将状态空间模型重新构想为在线学习器
2024-07
·
7 分钟
·
3200 字
从 30 分钟到 3 分钟:MInference 如何将百万词元提示的 LLM 等待时间缩短
2024-07
·
5 分钟
·
2328 字
深入解析 FlashAttention-3:异步与 FP8 如何为 Transformer 加速
2024-07
·
6 分钟
·
2698 字
六月
13
MEMENTO: Teaching Neural Solvers to Remember — Faster, Smarter Routing with Memory-Augmented Inference
2024-06
·
15 分钟
·
7267 字
协作式“学习如何学习”——陪练伙伴如何提升元学习效果
2024-06
·
7 分钟
·
3232 字
为神经过程注入强劲动力:上下文内上下文学习如何利用相似数据集
2024-06
·
7 分钟
·
3457 字
为 Transformer 瘦身:通过边剪枝揭示隐藏电路
2024-06
·
3 分钟
·
1361 字
超越神经元:使用 Transcoder 在大语言模型中寻找可解释回路
2024-06
·
7 分钟
·
3377 字
解构大语言模型:深入探究稀疏自编码器的缩放
2024-06
·
7 分钟
·
3048 字
解码黑箱:为何让大语言模型更具可解释性,也可能让它们更智能
2024-06
·
7 分钟
·
3249 字
为什么你的AI会遗忘——以及专家团队如何解决它:深入探讨用于持续学习的混合专家模型
2024-06
·
7 分钟
·
3424 字
对抗 AI 遗忘症:EVCL 如何结合贝叶斯推断与正则化来掌控持续学习
2024-06
·
6 分钟
·
2978 字
超越排行榜天花板:为什么 MMLU-Pro 是测试 LLM 的新黄金标准
2024-06
·
6 分钟
·
2958 字
超越单打独斗:VillagerAgent 如何教 AI 在《我的世界》中团队合作
2024-06
·
7 分钟
·
3426 字
超越思维链:CPO 如何在不降低速度的情况下让大语言模型更智能
2024-06
·
6 分钟
·
3002 字
超越像素:MASt3R 如何让二维图像匹配扎根于三维现实
2024-06
·
6 分钟
·
2923 字
五月
11
超越训练数据:深入解析MetaGS,实现逼真的3D重光照
2024-05
·
8 分钟
·
3514 字
解决 AI 的“健忘症”:深入解析 MGSER-SAM,实现更智能的持续学习
2024-05
·
6 分钟
·
2919 字
CAMeLU:利用上下文学习教 Transformer 从无标签数据中学习
2024-05
·
8 分钟
·
3845 字
驯服混乱:分组多样化 AI 模型如何增强无数据元学习
2024-05
·
6 分钟
·
2920 字
结合贝叶斯与元学习,摆脱灾难性遗忘
2024-05
·
7 分钟
·
3394 字
教 LLM 学习:MAML-en-LLM 如何解锁更强的情境学习能力
2024-05
·
6 分钟
·
2990 字
深入解析YOLOv10:它如何实现端到端的速度与SOTA精度
2024-05
·
7 分钟
·
3078 字
初识 MicroAdam:可证明收敛的内存节省型优化器
2024-05
·
6 分钟
·
2734 字
RNN 的回归?深入解读 xLSTM
2024-05
·
10 分钟
·
4633 字
Mamba‑2 解析:连接状态空间模型与注意力机制的对偶性
2024-05
·
10 分钟
·
4964 字
2024-05
·
6 分钟
·
2964 字
四月
7
永不停学:CLP 算法如何让机器人在真实世界中自适应
2024-04
·
7 分钟
·
3132 字
教大语言模型即学即会:深入解析用于关系抽取的 MICRE
2024-04
·
7 分钟
·
3330 字
解决 AI 的“失忆症”:深入解析基于效用的扰动梯度下降 (UPGD)
2024-04
·
7 分钟
·
3164 字
归纳、演绎、溯因:解构大语言模型的三大推理谜题
2024-04
·
6 分钟
·
2831 字
学习泛化:元学习如何破解域泛化难题
2024-04
·
8 分钟
·
3748 字
一次训练,永续推断:深入探讨摊销神经推断
2024-04
·
10 分钟
·
4968 字
从 2D 像素到 3D 溅射:GS-LRM 如何仅凭几张图像重建世界
2024-04
·
5 分钟
·
2408 字
三月
8
永不止步的 Transformer:深入探讨在线持续学习
2024-03
·
7 分钟
·
3142 字
超越神经元:寻找并修复大语言模型内部的可解释回路
2024-03
·
7 分钟
·
3504 字
一个框架统领全局:统一持续学习并引入‘刷新学习’
2024-03
·
7 分钟
·
3159 字
MATHVERSE:AI 模型真的能看懂数学问题中的图表吗?
2024-03
·
8 分钟
·
3693 字
超越碰撞检测:教会 AI 理解事故发生的原因
2024-03
·
7 分钟
·
3169 字
MVSplat:仅用几张照片,构建令人惊叹的 3D 世界
2024-03
·
5 分钟
·
2446 字
超越 Transformer:VideoMamba 如何解锁高效的长视频理解
2024-03
·
6 分钟
·
2572 字
超越 Transformer:LocalMamba 如何释放状态空间模型在视觉领域的潜力
2024-03
·
5 分钟
·
2445 字
二月
12
将物资送给最需要的人:效用最大化的新视角
2024-02
·
8 分钟
·
3775 字
对抗 AI“失忆症”:深入解析 CORE 的认知回放
2024-02
·
6 分钟
·
2972 字
永不止步:我们如何让大型语言模型保持最新
2024-02
·
7 分钟
·
3371 字
GPT-4 能在《我的世界》中搞建筑吗?大型语言模型作为协作式游戏智能体
2024-02
·
6 分钟
·
2692 字
BitNet b1.58:可能永远改变 AI 的 1 比特大语言模型
2024-02
·
6 分钟
·
2966 字
超越梯度下降:Transformer 如何发现自己的优化算法
2024-02
·
6 分钟
·
2710 字
从零星数据中学习——深入探讨图上少样本学习
2024-02
·
7 分钟
·
3283 字
LLM 如何实现“现学现卖”?深入解析上下文学习
2024-02
·
7 分钟
·
3037 字
耐心的力量:分块更新如何解决延迟老虎机反馈问题
2024-02
·
6 分钟
·
2981 字
超越文本:GITA 如何教 AI 看懂图并进行推理
2024-02
·
6 分钟
·
2736 字
超越晴天:G-NAS 如何让目标检测器在黑暗中也能看清
2024-02
·
5 分钟
·
2462 字
LGM:使用高斯泼溅技术在 5 秒内创建高分辨率 3D 模型
2024-02
·
5 分钟
·
2480 字
一月
4
永不遗忘的 AI 新纪元:预训练模型持续学习指南
2024-01
·
8 分钟
·
3527 字
将3D高斯溅射场景压缩31倍,渲染速度提升4倍
2024-01
·
6 分钟
·
2632 字
Vision Mamba:Transformer 在计算机视觉领域的新挑战者?
2024-01
·
6 分钟
·
2581 字
VMamba:计算机视觉领域 CNN 与 Transformer 的新挑战者
2024-01
·
5 分钟
·
2402 字
2023
78
十二月
6
教神经网络记忆:一种能学习自身学习算法的人工智能
2023-12
·
8 分钟
·
3551 字
从涌现中学习:抑制“记忆型”神经元如何提升 AI 性能
2023-12
·
7 分钟
·
3399 字
AI 如何利用知识图谱学会做出有根据的猜测
2023-12
·
7 分钟
·
3008 字
MP5:如何构建一个会思考、感知和规划的《我的世界》AI
2023-12
·
7 分钟
·
3247 字
超越真实感:Feature 3DGS 为 3D 场景带来 AI 理解能力
2023-12
·
6 分钟
·
2561 字
DUSt3R 如何重新定义三维重建——无需相机信息
2023-12
·
6 分钟
·
2768 字
十一月
10
Meta-Adapter:一种“学会学习”的方法,仅用少量样本即可增强 CLIP
2023-11
·
7 分钟
·
3141 字
对抗 AI 的“胡言乱语”:介绍用于评估视觉幻觉的新基准 AMBER
2023-11
·
6 分钟
·
2878 字
超越浅层对齐:CogVLM 如何让语言模型学会“看见”
2023-11
·
7 分钟
·
3183 字
破解黑盒:深入探究大语言模型如何即时学习
2023-11
·
7 分钟
·
3382 字
解开纠缠之网:元学习、在线学习与持续学习指南
2023-11
·
9 分钟
·
4072 字
提炼公平性:公平 Wasserstein 核集如何应对大数据中的偏见问题
2023-11
·
8 分钟
·
3698 字
LightGaussian:将 3D 场景压缩 15 倍,同时提升渲染速度
2023-11
·
5 分钟
·
2264 字
GaussianShader:为实时渲染带来逼真的反射效果
2023-11
·
6 分钟
·
2649 字
GS-SLAM:高斯溅射开启实时3D建图新纪元
2023-11
·
5 分钟
·
2281 字
Mip-Splatting:三维高斯溅射中实现清晰变焦的秘密
2023-11
·
4 分钟
·
1895 字
十月
6
LSTM 能学会如何学习吗?深入探讨外积 LSTM
2023-10
·
7 分钟
·
3432 字
BitNet:1-bit Transformer 开启大语言模型新纪元
2023-10
·
6 分钟
·
2871 字
ClusT3:利用信息不变聚类适应未知环境
2023-10
·
7 分钟
·
3326 字
超越 Transformer:用 Monarch Mixer 实现深度学习的亚二次方扩展
2023-10
·
8 分钟
·
3941 字
GaussianDreamer:融合2D与3D AI,15分钟从文本生成惊艳3D模型
2023-10
·
6 分钟
·
2716 字
解锁海量上下文:深入解读 DISTFLASHATTN
2023-10
·
5 分钟
·
2385 字
九月
4
超越神经元:用稀疏自动编码器发现语言模型中的真正特征
2023-09
·
7 分钟
·
3083 字
超越实验室:一百万次真实世界对话揭示了 LLM 的什么?
2023-09
·
7 分钟
·
3177 字
AI 能取代人类训练大语言模型吗?深入探讨 RLAIF
2023-09
·
7 分钟
·
3038 字
Promptbreeder:大型语言模型如何自我教学,成为更优秀的问题解决者
2023-09
·
7 分钟
·
3306 字
八月
2
用自然语言解锁数据库:深入探索 DAIL-SQL 与提示工程
2023-08
·
7 分钟
·
3234 字
实时辐射场:深入解析3D高斯溅射技术
2023-08
·
6 分钟
·
2593 字
七月
5
学会学习:深入探索元学习的世界
2023-07
·
8 分钟
·
3576 字
MetaDiff:我们能像训练扩散模型一样训练少样本学习器吗?
2023-07
·
6 分钟
·
3004 字
永不遗忘:随机投影如何帮助 AI 持续学习
2023-07
·
8 分钟
·
3516 字
RLHF 的问题:深入剖析用人类反馈训练 AI 的缺陷
2023-07
·
7 分钟
·
3136 字
FlashAttention-2:为 Transformer 带来更迅捷、更高效的注意力机制
2023-07
·
7 分钟
·
3084 字
六月
11
Wanda:一种同时关注权重
和
激活值的 LLM 剪枝方法
2023-06
·
7 分钟
·
3380 字
超网络:构建其他神经网络的神经网络
2023-06
·
7 分钟
·
3315 字
深度学习的阿喀琉斯之踵:为什么神经网络会忘记如何学习
2023-06
·
7 分钟
·
3426 字
PandaLM 简介:让其他 AI 模型更聪明的 AI 裁判
2023-06
·
6 分钟
·
2869 字
LLM-Blender:融合语言模型精粹,打造更智能的AI
2023-06
·
6 分钟
·
2791 字
视觉语言模型究竟有多强?深入解析 MME 基准测试
2023-06
·
5 分钟
·
2373 字
AI 能评判 AI 吗?深入探讨使用 LLM 进行聊天机器人评估
2023-06
·
7 分钟
·
3374 字
认识 STEVE-1:研究人员如何仅用 60 美元就教会一个 Minecraft 智能体听懂指令
2023-06
·
8 分钟
·
3669 字
我们如何从少量信息中学到如此之多:一个用自然语言思考的贝叶斯模型
2023-06
·
6 分钟
·
2966 字
用…SGD求解巨型高斯过程?深入探究良性非收敛现象
2023-06
·
6 分钟
·
2656 字
超越 FlashAttention:利用动态稀疏性让 Transformer 再提速
2023-06
·
5 分钟
·
2270 字
五月
11
注意力机制的内存“零”开销:深入解析恒定内存注意力神经过程
2023-05
·
8 分钟
·
3570 字
超越少样本学习:LLM 如何教会自己更好地学习
2023-05
·
7 分钟
·
3039 字
追求完美记忆:深入剖析理想的持续学习者
2023-05
·
7 分钟
·
3233 字
强经验回放:对抗灾难性遗忘的新利器
2023-05
·
7 分钟
·
3124 字
更深不一定更好:理解现代神经网络中的“隧道效应”
2023-05
·
6 分钟
·
3004 字
BIRD 已经降临:一个新的基准测试,用于检验 LLM 是否真的能与大数据对话
2023-05
·
7 分钟
·
3309 字
GITM:一个由 LLM 驱动的“幽灵”如何掌控《我的世界》的科技树
2023-05
·
7 分钟
·
3334 字
超越监督学习:用强化学习微调扩散模型
2023-05
·
7 分钟
·
3262 字
深度集成为何有效?新理论将其与贝叶斯方法统一
2023-05
·
6 分钟
·
2689 字
解锁黑箱:大语言模型中思维链背后的理论
2023-05
·
9 分钟
·
4409 字
超越微调:深入探究任务算术与权重解耦
2023-05
·
6 分钟
·
2523 字
四月
5
分割任意对象:为图像分割构建基础模型
2023-04
·
13 分钟
·
6378 字
思维链为何有效:关键在于局部经验
2023-04
·
7 分钟
·
3084 字
逆向工程 AI:深入探索自动化电路发现
2023-04
·
7 分钟
·
3226 字
为什么随机切分是解释聚类的最佳方法
2023-04
·
6 分钟
·
2531 字
从v1到v8及更远:YOLO的完整发展史
2023-04
·
8 分钟
·
3529 字
三月
7
AGI 的火花:深入探讨 GPT-4 惊人的能力
2023-03
·
9 分钟
·
4214 字
学会学习:元学习如何攻克金融AI中的数据稀缺难题
2023-03
·
6 分钟
·
2837 字
学会学习:元学习在小样本场景下的深度指南
2023-03
·
10 分钟
·
4769 字
Reflexion:语言模型如何通过与自己对话来从错误中学习
2023-03
·
7 分钟
·
3254 字
当你的模型遇到真实世界——深入解析测试时自适应
2023-03
·
10 分钟
·
4996 字
超越试错:LLM 智能体如何通过自言自语进行学习
2023-03
·
6 分钟
·
2771 字
Zero-1-to-3:AI如何从单张照片想象出3D物体
2023-03
·
6 分钟
·
2750 字
二月
8
Mnemosyne:学习优化其他神经网络的 Transformer
2023-02
·
7 分钟
·
3091 字
永不止步:AI持续学习深度指南
2023-02
·
12 分钟
·
5744 字
ESMER:一种受大脑启发的解决方案,用于修复神经网络中的灾难性遗忘
2023-02
·
6 分钟
·
2955 字
终身学习背后的数学:深入探究遗忘与泛化
2023-02
·
7 分钟
·
3319 字
Transformer 没了安全网还能走多深?驯服原生模型中的信号传播
2023-02
·
7 分钟
·
3225 字
告别从零开始:用先验数据为强化学习增效的简单秘诀
2023-02
·
7 分钟
·
3285 字
EvoPrompting:如何将语言模型进化为 AI 架构大师
2023-02
·
6 分钟
·
2634 字
TPVFormer:用三视角视图从二维快照重建三维世界
2023-02
·
6 分钟
·
2674 字
一月
3
BLIP-2:如何高效地教会大型语言模型“看见”
2023-01
·
7 分钟
·
3266 字
SparseGPT:如何在无需再训练的情况下从 LLM 中删除 1000 亿参数
2023-01
·
7 分钟
·
3184 字
学习如何学习:深入探索元强化学习
2023-01
·
10 分钟
·
4648 字
2022
25
十二月
3
Whisper:深入探究 OpenAI 对人类级语音识别的追求
2022-12
·
8 分钟
·
3549 字
超越记忆:Transformer 如何元学习通用学习算法
2022-12
·
7 分钟
·
3114 字
Pile 数据集上的饿饿河马:Transformer 王座的新挑战者
2022-12
·
6 分钟
·
2878 字
十一月
2
从薛定谔桥到神经网络:一种新的端到端熵正则化最优传输求解器
2022-11
·
5 分钟
·
2500 字
重新思考神经网络设计:深度剖析梯度路径分析
2022-11
·
6 分钟
·
2603 字
十月
1
NeRF、高斯泼溅及未来:神经辐射场导览
2022-10
·
8 分钟
·
4007 字
九月
4
多模态AI巡礼:塑造未来的六大核心挑战
2022-09
·
12 分钟
·
5649 字
超越重用:教会元学习模型习得新特征
2022-09
·
7 分钟
·
3113 字
当神经元变得拥挤:深入探究叠加现象
2022-09
·
11 分钟
·
5340 字
扩散模型的全景之旅:从基础到前沿
2022-09
·
11 分钟
·
5278 字
八月
1
超越缺口:深入解析 SSSD 在时间序列插补与预测中的应用
2022-08
·
5 分钟
·
2470 字
七月
1
AdaptCL:在不断变化的数据上训练单一 AI 模型且不会遗忘
2022-07
·
7 分钟
·
3380 字
六月
3
寻找更平坦的谷底:Sharp-MAML 如何改进小样本学习
2022-06
·
7 分钟
·
3477 字
为学习而生:打造能够自我适应与演化的人工智能
2022-06
·
7 分钟
·
3269 字
更简单的 S4:对角状态空间模型(S4D)如何以更低复杂度实现同等性能
2022-06
·
6 分钟
·
2778 字
五月
1
FlashAttention:IO 感知是解锁长上下文 Transformer 的关键吗?
2022-05
·
6 分钟
·
2600 字
三月
4
InstructGPT:通过人类反馈教 GPT-3 遵循指令
2022-03
·
9 分钟
·
4119 字
解码 MAML:一种用于超快速神经架构搜索的新核函数
2022-03
·
6 分钟
·
2900 字
超越大数据:深入探索小样本学习
2022-03
·
8 分钟
·
3735 字
为什么AI会遗忘,而我们(通常)不会:来自大脑中“持续学习者”的启示
2022-03
·
7 分钟
·
3490 字
二月
2
学习如何学习:自修改网络如何解锁真正的人工智能适应性
2022-02
·
8 分钟
·
3642 字
SASHIMI:用状态空间模型切分原始音频
2022-02
·
2 分钟
·
780 字
一月
3
大道至简:EASY 如何用简单技巧实现顶尖小样本学习
2022-01
·
7 分钟
·
3373 字
重写过去,预备未来:深入解析持续学习模型 X-DER
2022-01
·
8 分钟
·
3776 字
让每个像素都物尽其用:深入解析高效非局部对比注意力
2022-01
·
5 分钟
·
2473 字
2021
27
十二月
2
向大师学习:深入解析 Ex-Model 持续学习
2021-12
·
7 分钟
·
3280 字
潜在扩散模型如何生成令人惊叹的 AI 艺术(Stable Diffusion 论文详解)
2021-12
·
8 分钟
·
3515 字
十一月
1
教机器描述视频:深入解析 SWINBERT
2021-11
·
5 分钟
·
2437 字
十月
4
SpeechT5:一个模型统领所有语音与文本任务
2021-10
·
4 分钟
·
1685 字
教语言模型即时学习:深入解析上下文调优 (ICT)
2021-10
·
6 分钟
·
2929 字
超越提示工程:MetaICL 如何教会语言模型即时学习
2021-10
·
6 分钟
·
2836 字
序列模型的瑞士军刀:深入探究线性状态空间层
2021-10
·
6 分钟
·
2727 字
九月
1
只需告诉模型做什么:指令精调如何解锁零样本学习能力
2021-09
·
9 分钟
·
4045 字
八月
1
当程序库没有规则:一个数据驱动的侦探故事,揭秘代码规约
2021-08
·
7 分钟
·
3257 字
七月
1
深入 Codex:驱动 GitHub Copilot 的 AI 结对程序员
2021-07
·
6 分钟
·
2529 字
六月
5
超越 Adam:AI 如何学会优化神经网络
2021-06
·
7 分钟
·
3492 字
元学习的进化提速:深入解析 EvoGrad
2021-06
·
7 分钟
·
3279 字
一个模型统治所有?为何持续学习需要一个“模型动物园”
2021-06
·
7 分钟
·
3224 字
Decision Transformer:当语言模型学会玩游戏
2021-06
·
6 分钟
·
2799 字
LoRA:用万分之一的参数,微调超大语言模型
2021-06
·
5 分钟
·
2406 字
五月
1
为什么视觉变换器出人意料地稳健:来自《视觉变换器是稳健的学习者》的洞见
2021-05
·
12 分钟
·
5725 字
四月
3
AST:视觉 Transformer 是如何学会聆听的
2021-04
·
7 分钟
·
3212 字
用手术刀探测:发现语言模型已知的内容
2021-04
·
7 分钟
·
3105 字
GANcraft:用 AI 将我的世界(Minecraft)世界变为照片般逼真的现实
2021-04
·
7 分钟
·
3391 字
三月
4
CLIP 解析:用语言教视觉模型(以及为什么有效)
2021-03
·
15 分钟
·
7209 字
超越 MAML:自适应学习与任务优先化如何增强元学习
2021-03
·
6 分钟
·
2689 字
不止是回放,更要学会如何回放:用 MetaSGD 为持续学习增压
2021-03
·
6 分钟
·
2790 字
终身学习:梯度投影记忆如何战胜灾难性遗忘
2021-03
·
7 分钟
·
3289 字
二月
2
超越小样本:让元学习适用于大规模任务
2021-02
·
7 分钟
·
3424 字
数小时而非数天找到顶尖神经网络:深入解读免训练 NAS
2021-02
·
6 分钟
·
2809 字
一月
2
从像素到令牌:T2T‑ViT 如何让 Transformer 在 ImageNet 上发挥作用
2021-01
·
10 分钟
·
4526 字
Switch Transformer:一个出乎意料高效的万亿参数 AI 模型
2021-01
·
7 分钟
·
3294 字
2020
37
十二月
2
从 O(n²) 到 O(n):深入探究极速 WordPiece 分词算法
2020-12
·
6 分钟
·
2547 字
SpAtten:通过剪枝冗余语言,让 Transformer 更加“斯巴达”
2020-12
·
6 分钟
·
2859 字
十一月
3
借助文本信息,提升小样本学习能力
2020-11
·
7 分钟
·
3115 字
学会学习:人工智能能教给我们关于大脑的什么(以及反之亦然)
2020-11
·
7 分钟
·
3238 字
超越偏差与方差:精细审视双下降现象
2020-11
·
10 分钟
·
4572 字
十月
4
如何教会 AI 新技能,又不忘旧本领
2020-10
·
7 分钟
·
3089 字
超越良好起点:PAMELA 如何学习快速适应的路径
2020-10
·
7 分钟
·
3247 字
Vision Transformer (ViT):教 Transformer 学会看图
2020-10
·
7 分钟
·
3152 字
LEAStereo – AI 如何学会设计顶尖的 3D 视觉模型
2020-10
·
7 分钟
·
3342 字
八月
1
超越双重下降:泛化的多尺度理论
2020-08
·
7 分钟
·
3225 字
七月
1
永不遗忘:La-MAML 如何教模型进行持续学习
2020-07
·
7 分钟
·
3092 字
六月
5
神经网络剪枝的隐藏规则:深入探究缩放定律
2020-06
·
7 分钟
·
3267 字
让 Transformer 飞起来 —— 深入探究线性注意力
2020-06
·
7 分钟
·
3065 字
数秒内找到顶级神经网络——无需任何训练
2020-06
·
6 分钟
·
2632 字
从噪声到高保真图像——深入解读去噪扩散模型
2020-06
·
5 分钟
·
2372 字
从过去中学习:保守 Q 学习如何解锁离线强化学习
2020-06
·
6 分钟
·
2710 字
五月
4
RAG:如何让你的大语言模型进行一场开卷考试
2020-05
·
7 分钟
·
3329 字
超越成对比较:用上下文提升小样本学习
2020-05
·
7 分钟
·
3169 字
超越最后一层:赋予解码器立体视觉,实现更智能的文本生成
2020-05
·
7 分钟
·
3116 字
超越最后一层:用多视角解码为 Transformer 注入强劲动力
2020-05
·
7 分钟
·
3240 字
四月
5
机器如何学会学习:元学习深度指南
2020-04
·
10 分钟
·
4968 字
学会学习:深入探索元学习的全景
2020-04
·
7 分钟
·
3079 字
从像素学习的速度大幅提升:深入解析 CURL
2020-04
·
5 分钟
·
2327 字
超越在线训练:介绍用于真实世界离线强化学习的 D4RL
2020-04
·
6 分钟
·
2973 字
YOLOv4: 打破速度与精度的平衡难题,单GPU即可训练的最强检测器
2020-04
·
5 分钟
·
2149 字
三月
4
聪明剪枝,而非蛮力:深入解析学习阈值剪枝
2020-03
·
6 分钟
·
2936 字
剪枝悖论:为何我们无法判断哪种神经网络剪枝方法是最好的
2020-03
·
8 分钟
·
3831 字
驯服二次方猛兽——路由 Transformer 如何扩展至超长序列
2020-03
·
6 分钟
·
2827 字
BigNAS:一次训练,随处部署的单阶段神经架构搜索
2020-03
·
6 分钟
·
2935 字
二月
5
超越黑箱:元学习为何如此擅长小样本学习?
2020-02
·
7 分钟
·
3009 字
MAML 为何有效?深入探究元学习理论
2020-02
·
7 分钟
·
3015 字
方差的惊人形状:重新思考深度学习中的偏差-方差权衡
2020-02
·
7 分钟
·
3124 字
训练更少,收获更多:对抗训练中过拟合的惊人真相
2020-02
·
7 分钟
·
3357 字
Backpropamine:教神经网络自我重构
2020-02
·
7 分钟
·
3156 字
一月
3
破解一次性 NAS 的密码:深入解析 NAS-Bench-1Shot1 基准
2020-01
·
6 分钟
·
2921 字
神经网络的公平竞技场:深入解析 NAS-Bench-201
2020-01
·
6 分钟
·
2777 字
量变引起质变 —— 语言模型性能惊人的可预测性
2020-01
·
6 分钟
·
2980 字
2019
15
十一月
1
能教会老模型新把戏吗?深入探究迁移学习
2019-11
·
9 分钟
·
4269 字
十月
4
超越“一刀切”的元学习:深入解读 MMAML
2019-10
·
7 分钟
·
3418 字
压缩、挑选、增长:一种更智能的 AI 无遗忘学习方式
2019-10
·
6 分钟
·
2892 字
超越 8 位:BitNet 如何让你的数字世界更平滑
2019-10
·
6 分钟
·
2883 字
从 ZeRO 到万亿:深入探究巨型 AI 模型背后的内存优化技术
2019-10
·
6 分钟
·
2979 字
九月
4
超越简单比较:PARN 如何教会网络“看见”物体的位置
2019-09
·
7 分钟
·
3295 字
稳定性–可塑性困境:持续学习研究导览
2019-09
·
10 分钟
·
5003 字
不要只测试——也要训练!利用自监督实时适应新数据
2019-09
·
7 分钟
·
3097 字
Megatron-LM:借助优雅的 PyTorch 并行化,将语言模型扩展至数十亿参数
2019-09
·
5 分钟
·
2486 字
六月
1
自适应地学习如何学习:深入解读 ARUBA 框架
2019-06
·
6 分钟
·
2951 字
五月
3
学会适应:深入解析 TapNet 在小样本分类中的投影力量
2019-05
·
7 分钟
·
3088 字
Alpha MAML:解除元学习中的超参数困扰
2019-05
·
6 分钟
·
2818 字
即时生成神经网络:深入解析 LGM-Net
2019-05
·
7 分钟
·
3492 字
三月
2
对齐,而非简单匹配:深入解读可解释的单样本学习
2019-03
·
7 分钟
·
3098 字
解读双下降:为什么更多参数能带来更好的模型
2019-03
·
4 分钟
·
1939 字
2018
23
十二月
4
超越微调:元迁移学习如何掌握小样本识别
2018-12
·
7 分钟
·
3082 字
超越单一起点:面向多样化和不相交任务的元学习
2018-12
·
6 分钟
·
2878 字
终身学习,既不遗忘(也不破产):深入解析 A-GEM
2018-12
·
7 分钟
·
3353 字
ProxylessNAS:直接在你的目标硬件上搜索最优神经网络
2018-12
·
6 分钟
·
2737 字
十一月
1
别忘了!经验回放如何解决人工智能的“失忆”问题
2018-11
·
7 分钟
·
3130 字
十月
1
深入解析 BERT:双向 Transformer 如何重新定义 NLP
2018-10
·
7 分钟
·
3355 字
七月
1
在潜在仙境中学习如何学习:深入解析 LEO
2018-07
·
8 分钟
·
3609 字
六月
2
PLATIPUS——当一个模型无法满足小样本学习
2018-06
·
7 分钟
·
3311 字
教神经网络如何记忆:深入探索元持续学习
2018-06
·
6 分钟
·
2951 字
五月
1
超越翻转与裁剪:AutoAugment 如何教 AI 增强自身数据
2018-05
·
7 分钟
·
3011 字
四月
3
如何教会神经网络从单个样本中学习
2018-04
·
7 分钟
·
3060 字
一个句子,多种分词:子词正则化在神经机器翻译中的威力
2018-04
·
7 分钟
·
3091 字
YOLOv3:渐进式改进如何打造实时检测利器
2018-04
·
5 分钟
·
2178 字
三月
3
超越标注数据:无标签样本如何助力小样本学习
2018-03
·
7 分钟
·
3258 字
Reptile:一个简单而强大的元学习技巧
2018-03
·
8 分钟
·
3549 字
你的神经网络中彩票了吗?解析“彩票假说”
2018-03
·
7 分钟
·
3402 字
二月
5
超越固定距离:条件嵌入如何重新定义小样本学习
2018-02
·
6 分钟
·
2938 字
超越原始像素:深度元学习如何教AI学习概念
2018-02
·
6 分钟
·
2966 字
解锁 AI 的终身学习:受大脑启发的门控机制如何防止灾难性遗忘
2018-02
·
7 分钟
·
3246 字
ELMo:语境与深度表示如何永久改变了 NLP
2018-02
·
6 分钟
·
2847 字
ENAS:让神经架构搜索快 1000 倍
2018-02
·
6 分钟
·
2995 字
一月
2
向终身学习致敬:硬注意力(HAT)如何防止神经网络失忆
2018-01
·
5 分钟
·
2123 字
Piggyback:让老网络掌握新技巧而不遗忘
2018-01
·
7 分钟
·
3293 字
2017
20
十二月
1
PNAS:如何在不耗尽资源的情况下找到顶级性能的神经网络
2017-12
·
5 分钟
·
2504 字
十一月
5
从少量样本中学习:深入解析用于小样本学习的图神经网络
2017-11
·
7 分钟
·
3280 字
以少胜多:利用无标签数据和智能查询增强原型网络
2017-11
·
6 分钟
·
2770 字
关系网络如何通过学习比较掌握小样本学习
2017-11
·
7 分钟
·
3159 字
用可扩展的回忆解决人工智能的“失忆症”
2017-11
·
8 分钟
·
3513 字
对抗 AI 遗忘症:PackNet 如何在不忘记旧知识的情况下教会网络新技巧
2017-11
·
7 分钟
·
3430 字
十月
1
超越 ReLU:自动化搜索如何发现 Swish 激活函数
2017-10
·
6 分钟
·
2522 字
八月
1
NLP 的“ImageNet 时刻”?机器翻译如何为我们带来情境化词向量
2017-08
·
7 分钟
·
3103 字
七月
2
快速学会学习:深入解析 Meta-SGD
2017-07
·
6 分钟
·
2883 字
PPO详解:易于实现、难以超越的强化学习算法
2017-07
·
6 分钟
·
2734 字
六月
2
永不忘记任务:深入解析梯度情节记忆 (GEM)
2017-06
·
7 分钟
·
3336 字
剖析 Transformer:这篇论文彻底改变了 NLP
2017-06
·
7 分钟
·
3110 字
五月
2
更快、更强、卷积:一种新的机器翻译架构
2017-05
·
8 分钟
·
3656 字
从像素到毕加索:深入探索神经风格迁移
2017-05
·
5 分钟
·
2298 字
三月
6
超越 Adam:我们能为神经网络学习一个更好的优化器吗?
2017-03
·
7 分钟
·
3502 字
教 AI 学会优化:学习型优化器如何实现扩展与泛化
2017-03
·
7 分钟
·
3366 字
用原型学习“如何学习”:深入解析原型网络
2017-03
·
7 分钟
·
3045 字
MAML:如何学会学习(无需天才)
2017-03
·
7 分钟
·
3282 字
神经网络能终身学习吗?深入解析突触智能
2017-03
·
7 分钟
·
3496 字
超越边界框:深入解析 Mask R-CNN
2017-03
·
7 分钟
·
3022 字
2016
13
十二月
2
解决 AI 的“失忆症”:深入解析弹性权重巩固
2016-12
·
7 分钟
·
3419 字
YOLO9000: 一个能识别9000种物体的实时检测器
2016-12
·
6 分钟
·
2736 字
十一月
3
永不遗忘:iCaRL 如何让深度学习模型持续学习
2016-11
·
7 分钟
·
3028 字
如何训练一个 AI 来设计其他 AI:深入解析神经架构搜索
2016-11
·
6 分钟
·
2757 字
ResNeXt:为深度神经网络设计增加一个新维度
2016-11
·
6 分钟
·
2612 字
九月
1
超网络——当一个神经网络学会构建另一个网络
2016-09
·
7 分钟
·
3164 字
七月
1
FastText 详解:字符 N‑gram 如何彻底改变词嵌入
2016-07
·
7 分钟
·
3253 字
六月
5
一击定乾坤——匹配网络如何从单个样本中学习
2016-06
·
7 分钟
·
3303 字
统领全场的 AI:训练神经网络成为优化器
2016-06
·
7 分钟
·
3129 字
基于经验构建:渐进式网络如何在不遗忘的情况下进行序列学习
2016-06
·
3 分钟
·
1168 字
如何教 AI 新技能,同时不让它忘记旧本领
2016-06
·
6 分钟
·
2732 字
超越切片:V-Net 如何彻底改变 3D 医学图像分割
2016-06
·
5 分钟
·
2444 字
二月
1
忘掉经验回放:深度强化学习中的 A3C 革命
2016-02
·
7 分钟
·
3114 字
2015
13
十二月
2
为什么你的 RNN 会过拟合——以及如何用贝叶斯 Dropout 解决它
2015-12
·
7 分钟
·
3015 字
更智能,而非更堆砌:谷歌 Inception V2 和 V3 如何重新思考深度学习架构
2015-12
·
6 分钟
·
2579 字
十一月
1
DCGAN 详解:利用生成式 AI 解锁无监督学习的力量
2015-11
·
5 分钟
·
2385 字
十月
1
CNN文本分类超参数终极指南
2015-10
·
7 分钟
·
3392 字
八月
2
超越单词:亚词单元如何解决机器翻译的核心难题
2015-08
·
7 分钟
·
3072 字
内容与风格:教会计算机像梵高一样绘画的算法
2015-08
·
6 分钟
·
2687 字
六月
4
打开黑箱:LSTM 如何学习长程依赖
2015-06
·
6 分钟
·
2550 字
Faster R-CNN: 让实时目标检测成为可能的突破性技术
2015-06
·
5 分钟
·
2179 字
YOLO:让计算机视觉实现实时检测的革命性突破
2015-06
·
6 分钟
·
2549 字
YOLO: 一眼识别世界的实时目标检测革命
2015-06
·
6 分钟
·
2525 字
五月
1
U-Net: 用小数据实现精准分割的深度学习架构
2015-05
·
5 分钟
·
2415 字
三月
1
终极LSTM对决:深入探索《搜索空间奥德赛》
2015-03
·
6 分钟
·
2917 字
二月
1
重新思考深度 RNN:门控反馈连接的力量
2015-02
·
5 分钟
·
2326 字
2014
11
十二月
2
LSTM vs. GRU:门控循环神经网络的对决
2014-12
·
6 分钟
·
2695 字
Adam优化器深度解析:现代深度学习的秘密武器
2014-12
·
5 分钟
·
2132 字
十一月
2
通用 vs. 专用:深入探究神经网络特征的可迁移性
2014-11
·
6 分钟
·
2771 字
FCN: 让 CNN 实现像素级语义分割的开创性工作
2014-11
·
5 分钟
·
2417 字
十月
1
教神经网络像计算机一样思考:神经图灵机
2014-10
·
5 分钟
·
2186 字
九月
3
突破瓶颈:注意力机制如何彻底改变神经机器翻译
2014-09
·
7 分钟
·
3488 字
开启现代自然语言处理革命的论文:理解基于 LSTM 的 Seq2Seq 模型
2014-09
·
6 分钟
·
2678 字
让 Dropout 在 RNN 上奏效的简单技巧
2014-09
·
6 分钟
·
2786 字
六月
3
GANs详解:深入解读开创时代的奠基之作
2014-06
·
7 分钟
·
3192 字
教机器看哪里:深入解析循环视觉注意力模型
2014-06
·
7 分钟
·
3391 字
打破固定尺寸限制:SPP-net 如何让 CNN 快 100 倍
2014-06
·
5 分钟
·
2470 字
2013
5
十二月
2
深度Q网络:人工智能如何从像素称霸雅达利游戏
2013-12
·
7 分钟
·
3326 字
解锁生成模型:深入解析变分自编码器
2013-12
·
8 分钟
·
3560 字
十一月
2
R-CNN: 深度学习如何彻底革新目标检测
2013-11
·
6 分钟
·
2671 字
打开黑盒:揭秘CNN如何学会"看见"
2013-11
·
6 分钟
·
2531 字
一月
1
引爆革命的论文:深入解读Word2Vec
2013-01
·
6 分钟
·
2810 字
2012
1
六月
1
从像素到概念:表征学习的力量
2012-06
·
11 分钟
·
5086 字
2011
1
三月
1
重新思考自然语言处理:如何(几乎)从零开始构建一个顶级标注器
2011-03
·
8 分钟
·
3580 字