引言

在庞大的在线社区生态系统中，语言不仅仅是沟通的工具，更是一种身份的象征。我们说话的方式标志着我们的归属。游戏玩家有特定的俚语，学者有他们的行话，政治团体也有独特的修辞。但是，当仇恨言论群体 (Hate Speech Group, HSG) 的成员离开他们封闭的回声室，进入主流讨论区时会发生什么？他们是为了融入而改变自己的语言，还是会带着有毒的模式随行？

这就是多伦多大学的 Jai Aggarwal 和 Suzanne Stevenson 在其研究论文 “Style-Shifting Behaviour of the Manosphere on Reddit” 中探讨的核心问题。

虽然许多研究主要关注检测毒性 (toxicity) 或激进化，但这项研究采取了细致的社会语言学方法。它审视了“男性圈 (Manosphere) ”——Reddit 上一群松散的厌女社区——并调查其成员在 r/AskReddit、r/Funny 或 r/News 等中立空间发帖时，是否会改变他们的语言风格。

研究结果引人入胜且稍显不安。结果表明，虽然仇恨团体的成员确实试图融入，但一种独特的“男性圈风格”仍然会渗透出来，可能会改变主流社区的基调和健康状况。在这篇深度文章中，我们将以此为基础，解析研究人员如何量化这种“风格”，他们如何在平台上追踪它，以及这对在线社交空间的健康意味着什么。

背景: 语体转换与男性圈

要理解这篇论文的贡献，我们首先需要定义两个关键概念: 语体转换 (Style-Shifting) 和男性圈 (Manosphere) 。

什么是语体转换？

在社会语言学中, 语体转换指的是个人根据社会语境调整语言的方式。你可能每天都在这样做。你给最好的朋友发信息的方式，可能与给教授或老板写邮件的方式截然不同。你会转换你的“风格”以适应你所处环境的规范。

在网络空间，这种情况一直在发生。一个用户可能在 r/Science 中使用正式、礼貌的语言，但在游戏子版块中切换到攻击性强、充满俚语的语言。研究人员想知道: 这条规则适用于仇恨团体的成员吗？

男性圈

Reddit 上的“男性圈”是一系列子版块的集合，它们因共同的厌女世界观而紧密联系。这包括关注“搭讪艺术 (PUA) ”、“男权运动 (MRA) ” (其更激进的形式) 和“非自愿独身者 (Incel) ”意识形态的群体。之前的研究将这些群体的特征描述为高度的毒性和激进化。然而，这篇论文认为，他们的语言不仅仅是“有毒的”——它具有一种特定的风格，涉及独特的词汇、语法结构和话题焦点。

方法论: 量化“风格”

研究人员面临一个艰巨的挑战: 如何用数学方法定义“语言风格”？为了回答研究问题，他们需要建立一个稳健的流程，能够区分男性圈的言论和“基准”Reddit 言论。

1. 数据收集

团队使用 Pushshift Reddit 数据集收集了 2014 年至 2017 年的数据。他们关注两组用户:

男性圈作者 (Manospheric Authors) : 在已确定的男性圈子版块中至少发表过 10 篇帖子的用户。
基准作者 (Baseline Authors) : 从未在男性圈发过帖的用户。

关键是，为了确保比较的公平性，他们根据活跃程度对这些作者进行了匹配。如果一个男性圈作者在 r/News 上发了 50 次帖，他们会被拿来与一个同样在 r/News 上发了大约 50 次帖的基准作者进行比较。

2. 特征工程

这篇论文的核心在于其语言特征。研究人员不仅仅是在寻找“脏话”。他们将语言分解为三个不同的类别:

A. 不文明语言特征 (Uncivil Language Features) 利用 Google 的 Perspective API 和其他情感分析工具，他们测量了:

毒性 (Toxicity) : 文本的仇恨或攻击性程度。
消极性 (Negativity) : 文本的情感效价。
不礼貌 (Impoliteness) : 缺乏礼貌标记的言语。

B. 句法特征 (语法和结构) 风格往往隐藏在我们就事物进行表达的方式中，而不仅仅是表达的内容。使用一种名为 LIWC (语言查询与词频统计) 的文本分析工具，研究人员提取了句法特征。如下表所示，这包括功能词，如代词 (我、你、她、他) 、标点符号和句子长度。这些特征非常强大，因为它们通常是无意识的；作者可能会隐藏他们的意图，但很少能隐藏他们的语法习惯。

表 A.1: 用于计算功能词和句法特征的 LIWC 类别。

C. 语义特征 (话题) 最后，他们研究了讨论的内容。他们使用 LIWC 将单词分类为语义主题，如“健康”、“金钱”、“宗教”，以及对本研究最重要的——“女性”和“男性”指称词。

表 A.2: 用于计算语义特征的 LIWC 类别。

3. 分类器

掌握了这些特征后，研究人员训练了逻辑回归模型。

平台级分类器: 训练用于区分在男性圈内部撰写的帖子和在男性圈外部撰写的帖子。
子版块特定分类器: 训练用于区分男性圈与特定目标子版块 (例如，男性圈 vs. r/Funny) 。

这些模型使研究人员能够为任何给定的帖子分配一个 “男性圈特质分数” (Manosphericness score) ——一个从 0 到 1 的概率分数，表明该帖子与男性圈的言论模式有多相似。

表 1: 由 (M)男性圈作者或 (B)基准作者撰写的帖子的男性圈特质分数 (范围 0-1) 。P2 和 P3 都是对同一帖子的回复: 有什么事情是你经常放过的，仅仅因为争论不值得？

上面的表 1 完美地展示了这个评分系统。帖子 \(P_1\) 是公然的仇恨言论，得分为 0.98 。然而，看看 \(P_2\)。它发布在 r/AskReddit 这个中立空间。它的得分为 0.60 , 表明虽然它不像 \(P_1\) 那么极端，但与基准回复 (\(P_3\)，得分 0.40) 相比，它仍然保留了男性圈的“味道”。

研究问题 1: 男性圈风格有什么特征？

在测量风格是否转换之前，研究人员必须定义这种风格是什么。他们使用所有语言特征训练了一个模型来对帖子进行分类。

表 2: RQ1: 使用所有 78 个特征、仅使用不文明 (uncivil) 特征、仅使用句法 (syntactic) 特征、仅使用男性/女性 (M/F) 特征以及我们最终的 34 个特征集训练的分类器比较。

如表 2 所示，使用所有 78 个特征产生的准确率最高 (0.69) 。有趣的是，仅使用不文明语言 (毒性) 是表现最差的预测指标 (0.56) 。这证明了一个关键点: 仇恨言论群体的定义不仅仅在于仇恨。 他们的风格是语法、话题和语气的复杂混合体。

对性别的痴迷

为了可视化具体哪些特征重要，研究人员分析了特征重要性。

图 E.1: 男性圈风格中前 20 个最重要的句法 (紫色) 、语义 (绿色) 和不文明 (橙色) 语言特征。

上图令人震惊。男性圈风格唯一最重要的预测指标是女性 (Female) 语义词汇 (与女性相关的词) 的使用。蓝色条 (男性圈) 几乎达到了最大重要性，而基准 (红色条) 则明显较低。

其他关键特征包括:

男性 (Male) 指称词。
“你 (You) ”代词: 暗示了一种对抗性、指责性的风格 (例如，“你就是问题所在”) 。
毒性: 很重要，但不如性别话题那么重要。

研究人员得出结论，男性圈风格的特征在于高度关注性别 (特别是女性) 、对抗性的框架以及毒性。

研究问题 2: 他们会转换风格吗？

现在来到核心的行为问题: 当一个男性圈用户在 r/WorldNews 或 r/Funny 发帖时，他们会抛弃这种风格吗？

为了测试这一点，作者比较了三种“男性圈特质”分数的分布:

蓝线: 男性圈作者在男性圈内部发帖。 (预期具有高男性圈特质) 。
红线: 基准作者在特定子版块 (如 r/Funny) 发帖。 (预期具有低男性圈特质) 。
绿线: 男性圈作者在该特定子版块 (即男性圈外部) 发帖。

如果男性圈作者完美地适应了环境 (语码转换) ，绿线将与红线重叠。他们听起来会和大家一样。

如果他们根本不适应，绿线将与蓝线重叠。他们听起来会和他们在仇恨团体里一样。

结果是: 他们处于中间状态。

图 1: RQ2: 三个特定子版块测试集中作者级男性圈特质分数的分布。这三个子版块分别显示了低 (r/WorldNews) 、中 (r/Funny) 和高 (r/AskReddit) 程度的语体转换。

仔细观察图 1。

转换 (绿线 vs. 蓝线) : 绿线明显位于蓝线的左侧。这证明男性圈作者确实进行了语体转换。当他们进入公共空间时，他们会收敛自己的言辞。
溢出 (绿线 vs. 红线) : 然而，绿线仍然位于红线的右侧。即使他们试图融入，他们在“男性圈特质”上的得分仍然始终高于普通用户。

这种模式在几乎所有测试的子版块中都成立，如下面的综合图所示。无论是在 r/Gaming、r/Politics 还是 r/AdviceAnimals，男性圈作者始终与基准人群存在差异。

图 F.1: 男性圈作者在所有 14 个非男性圈子版块中的语体转换情况。

绿线和红线之间的这种差距代表了 “风格溢出” (Stylistic Spillover) 。仇恨团体的风格正在泄漏到更广阔的互联网中。

研究问题 3: 什么元素溢出了？

我们知道有些东西被带过来了，但具体是什么？仅仅是他们使用了更多的脏话，还是有更深层的原因？

研究人员进行了回归分析，以查看男性圈作者在中立空间中比基准作者更多地使用了哪些具体特征。重要的是，他们控制了“父帖” (用户回复的帖子) 。这确保了我们看到的不仅仅是男性圈用户在回复有毒的帖子；这衡量了他们对对话的额外贡献。

表 3: RQ3: 风格溢出效应的回归系数估计值，括号内为标准误差值。 *** 表示显著性 p < 0.001

表 3 揭示了溢出的具体成分:

**毒性、不礼貌、消极性: ** 即使在中立子版块中，男性圈作者也始终比基准作者更不文明。
**女性焦点: ** 他们使用的与女性相关的词汇明显更多。
**男性焦点: ** 有趣的是，系数为负 (-0.016) 。在男性圈之外，他们谈论男性的频率比基准线更低，但他们保持了对女性的高度关注。

实例分析

数字很有用，但例子能让发现变得真实。表 4 提供了这种溢出效应的具体例子。

表 4: RQ3: (M)男性圈作者和 (B)基准作者对父帖回复的比较。

在第一个例子 (回复 1) 中，一位基准用户在 r/AskMen 中抱怨“古龙水”。回复同一提示的男性圈用户立即将话题转移到了“把女人捧上神坛”。

在第二个例子 (回复 2) 中，r/Videos 中的一位基准用户称一名女性为“妞 (chick) ”，说她需要“认清现实”。男性圈用户则将其急剧升级为暴力意象 (“头被……打”) 。

这些例子完美地说明了统计结果: 溢出表现为暴力/毒性强度的增加，以及无休止地将话题引向厌女的不满。

结论与启示

这项研究提供了有力的证据，表明在线仇恨言论群体的影响力远远超出了他们自己的边界。男性圈已经形成了一种独特的语言指纹——以性别痴迷和对抗为特征——其成员像口音一样随身携带。

虽然这些用户确实进行了语体转换 (在进入主流社区时收敛言辞) ，但他们并没有完全同化。相反，他们将更高水平的毒性和厌女话题焦点引入了 r/AskReddit、r/Movies 和 r/News 等社区。

为什么这很重要

**社区健康: ** 这种“溢出”充当了一种低浓度污染物。即使一个帖子没有毒到被版主封禁的程度，它也会将社区的对话规范转向敌意和性别偏见。
**检测: ** 传统的审核通常寻找关键词或极端的诽谤语。这项研究表明，“风格”是语法和话题的复杂组合。检测微妙的影响需要更复杂的模型，不仅要看具体的坏词，还要看事物是如何被表达的。
**激进化: ** 通过将这些话题带入主流空间，男性圈行动者可能会使其世界观正常化，这可能成为从一般兴趣社区招募新成员的门户。

Aggarwal 和 Stevenson 的工作提醒我们，在线社区不是孤岛。它们具有渗透性，在网络最阴暗角落发展出的语言最终会找到通往光明的路。理解这些语言暗流是减轻其有害影响的第一步。

引言#

背景: 语体转换与男性圈#

什么是语体转换？#

男性圈#

方法论: 量化“风格”#

1. 数据收集#

2. 特征工程#

3. 分类器#

研究问题 1: 男性圈风格有什么特征？#

对性别的痴迷#

研究问题 2: 他们会转换风格吗？#

研究问题 3: 什么元素溢出了？#

实例分析#

结论与启示#

为什么这很重要#

引言