](https://deep-paper.org/en/paper/2409.15376/images/cover.png)
超越死记硬背:ControlMath 如何教会 LLM 真正理解数学
大型语言模型 (LLM) 是令人难以置信的对话者、诗人和程序员。然而,当你要求它们解决一道独特的数学题——一道不是它们见过无数次的教科书例题的翻版——它们往往会跌跌撞撞。 ...
](https://deep-paper.org/en/paper/2409.15376/images/cover.png)
大型语言模型 (LLM) 是令人难以置信的对话者、诗人和程序员。然而,当你要求它们解决一道独特的数学题——一道不是它们见过无数次的教科书例题的翻版——它们往往会跌跌撞撞。 ...
](https://deep-paper.org/en/paper/2410.04628/images/cover.png)
如果你曾经尝试过使用像 GPT-4 或 LLaMA 这样的大型语言模型 (LLM) 来处理严格的数据处理任务,你很可能遇到过一种令人沮丧的现象。你提供了一个包含一系列具体要求的提示词——也许是必须出现在生成的名为用户画像中的十个不同的人口统计事实——模型自信地生成了一段流畅、听起来很专业的段落。 ...
](https://deep-paper.org/en/paper/file-2897/images/cover.png)
自然语言处理 (NLP) 通常处于工程学与语言学的交叉路口。一方面,我们拥有旨在高效处理文本的模型;另一方面,我们面对的是关于人类语言如何实际运作的深奥且复杂的理论。连接这两个世界最成功的尝试之一就是 通用依存库 (Universal Dependencies,简称 UD) 。 ...
](https://deep-paper.org/en/paper/2406.19185/images/cover.png)
基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback, RLHF) 已成为将原始大语言模型 (LLM) 转化为有用助手的标准方法。如果你玩过 ChatGPT 或 Llama,那你正在交互的模型很可能就经历过这一过程。 ...
](https://deep-paper.org/en/paper/2406.15576/images/cover.png)
想象一下,你是一位正在分析 20 世纪 60 年代政治气候的历史学家。你已经数字化了那个时代的数百万页报纸。你想追踪媒体对“约翰·肯尼迪 (John Kennedy)”的报道。 ...
](https://deep-paper.org/en/paper/2406.11064/images/cover.png)
引言 我们都有过对语音助手感到失望的经历。在安静的客厅里,它们能完美地理解我们。但试着在经过建筑工地或坐在嘈杂的咖啡馆里口述一条信息,系统就会崩溃。 ...
](https://deep-paper.org/en/paper/2406.01806/images/cover.png)
引言 我们目前正见证着大型语言模型 (LLM) 在各个领域的广泛应用——从编写代码、总结邮件,到诊断疾病和分析财务数据。然而,尽管 LLM 文采斐然,它们却有一个众所周知的可靠性问题: 它们会产生幻觉。它们能像陈述事实一样,带着同样的权威感陈述谬误。 ...
](https://deep-paper.org/en/paper/file-2892/images/cover.png)
在大型语言模型 (LLM) 飞速发展的当下,除了 GPT-4 和 Llama 等工具带来的惊人能力外,一个新的挑战也随之浮现: 溯源 。 我们如何判断一段文本是由人类编写的,还是由机器生成的?这不仅仅是学术上的好奇,更对剽窃、虚假信息和版权有着深远的影响。 ...
](https://deep-paper.org/en/paper/2408.08470/images/cover.png)
引言 我们正处于大语言模型 (LLMs) 的黄金时代。从 GPT-4 到 Llama 3,这些模型充当着推理引擎,能够表现出令人惊叹的类人行为。然而,每一位开发者、学生和研究人员都面临着一个持续存在的瓶颈: 延迟 。 ...
](https://deep-paper.org/en/paper/2410.09123/images/cover.png)
知识图谱 (Knowledge Graphs, KGs) 是我们日常使用的许多 AI 应用背后的幕后引擎。从搜索引擎到推荐系统,KG 将现实世界的事实结构化为三元组: (头实体, 关系, 尾实体)。例如,(达·芬奇, 绘制了, 蒙娜丽莎)。 ...
](https://deep-paper.org/en/paper/2404.11791/images/cover.png)
简介 大语言模型 (LLM) 彻底改变了我们处理文本的方式,自然而然地,它们也正在重塑信息检索 (IR) 领域。当你搜索某些内容时,你希望最好的结果排在最前面( 排名 ),同时也想知道这些结果实际上有多相关( 相关性预测 )。 ...
](https://deep-paper.org/en/paper/2410.04194/images/cover.png)
数学常被称为通用语言。但人类在教科书中书写的数学 (非形式化、直观且充满自然语言) 与计算机可验证的数学之间存在显著差异。后者需要形式化 (formalization) , 即将数学概念严谨地转换为定理证明器 (如 Isabelle 或 Lean) 可以执行并检查逻辑有效性的代码。 ...
](https://deep-paper.org/en/paper/2403.05330/images/cover.png)
引言 想象一下,你有一本内容精彩的百科全书,但它是在 2021 年印刷的。它知道那时的美国总统是谁,但对当前的时事、新的科学发现或书中错误的修正一无所知。这正是我们面对大型语言模型 (LLM) 时所处的困境。它们是互联网在特定时间点的静态快照。 ...
](https://deep-paper.org/en/paper/file-2885/images/cover.png)
如果你有一部智能手机,那你大概率熟悉数百万人的晨间仪式: 打开《纽约时报》 (New York Times) 的游戏应用。虽然 Wordle 测试你的词汇量,Sudoku 测试你的逻辑,但有一款游戏总是能在各地的群聊中引发挫败感、喜悦和激烈的讨论: Connections 。 ...
](https://deep-paper.org/en/paper/2401.17169/images/cover.png)
引言 我们经常谈论大语言模型 (LLMs) 如何“智能”,能够通过律师资格考试、编写代码并总结历史。但当我们剥离海量的百科知识,审视推理的本质时,它们到底有多聪明?具体来说,它们是否理解支撑人类语言的基础逻辑? ...
](https://deep-paper.org/en/paper/2406.10995/images/cover.png)
像 LLaVA 和 GPT-4V 这样的大型视觉语言模型 (LVLM) 的发展已经彻底改变了机器理解世界的方式。这些模型通常分两个阶段进行训练: 首先是基于图像-字幕对的大规模预训练,其次是视觉指令微调 (Visual Instruction Tuning, VIT) 。 第二个阶段至关重要——它教会模型真正听从用户指令、回答问题并对视觉内容进行推理。 ...
](https://deep-paper.org/en/paper/2410.01079/images/cover.png)
LLM 是否用一种通用语言思考?解码概念空间对齐 当你要求像 Llama-2 或 BLOOMZ 这样的多语言大语言模型 (LLM) 将一句话从英语翻译成法语,或者用日语推理一个概念时,其内部究竟发生了什么? ...
](https://deep-paper.org/en/paper/file-2881/images/cover.png)
引言 在现代数字环境中,模因 (Meme,俗称“梗”) 的演变早已超越了有趣的猫咪图片或令人感同身受的反应图。它们已成为互联网的一种主要方言——一种复杂的多模态交流形式,能够塑造舆论、传播文化,甚至影响选举结果。例如,在过去的两次美国总统大选中,模因作为协调媒体内容被武器化,用于左右选民。 ...
](https://deep-paper.org/en/paper/file-2880/images/cover.png)
引言: 从封锁转向建设——焦点的转移 在过去二十年里,自然语言处理 (NLP) 与社交媒体的交叉研究主要集中在一种数字形式的“废物管理”上。研究人员和工程师们构建了复杂的分类器来检测并移除“垃圾”——仇恨言论、毒性内容、虚假信息和垃圾邮件。虽然这项工作对数字卫生至关重要,但它代表了对在线话语一种略显片面的看法。我们花费了大量精力教机器人类不应该说什么,却很少花时间教它们健康的交流实际上是什么样子的。 ...
](https://deep-paper.org/en/paper/2405.12801/images/cover.png)
在信息检索 (IR) 和自然语言处理 (NLP) 的世界里,我们一直在平衡两股对立的力量: 速度与精度 。 当你在搜索引擎或聊天机器人中输入查询时,你期望在几毫秒内得到答案。为了实现这一点,系统依赖于快速、轻量级的模型。然而,你也期望答案是完全相关的。实现高相关性通常需要沉重、复杂的模型来深度“阅读”每一个候选文档。 ...