自然语言处理系统真的能理解讽刺和反语吗？

机器“检测”讽刺意味着什么？

当研究人员说某个系统能“检测”讽刺时，指的是它能以一定准确率将一段文本（或图文组合）归类为讽刺或非讽刺——而非系统真正理解了其中的幽默或意图。例如，2025年推出的SemIRNet模型通过融合文本、图像以及来自ConceptNet的常识知识[1]，在多模态讽刺基准测试中达到了88.87%的准确率和86.33%的F1分数。这确实令人印象深刻，但它本质上仍是统计模式匹配任务：模型只是学会了某些词图组合（如正面文字搭配负面图像）很可能具有讽刺意味，而并非真正“领会”了笑点。

类似地，2024年一款采用级联多头注意力架构的乌尔都语讽刺检测系统，在精选推文数据集上的表现优于更简单的模型[3]；而2023年基于孟加拉语BERT的系统在Facebook/YouTube评论数据集上达到了99.60%的准确率[7]。这些数据表明，只要有足够的训练数据和合适的架构，机器就能非常擅长识别讽刺模式——但它们仍然脆弱。2025年一项涵盖15项研究的综述指出，即便使用TF-IDF特征的简单逻辑回归模型，也能在Reddit数据集上达到72.3%的准确率和0.75的ROC-AUC值，这证实了表层线索（如词汇选择和标点符号）携带了大量信号[6]。问题在于：当讽刺依赖于共享文化知识、语气语调或对话语境的微妙变化时，这些系统往往失效。

为何语境与多数据类型能提升性能——以及它们仍存在的局限

讽刺性语言高度依赖语境，融合对话历史、说话者特征或多模态数据（文本、音频、视频）的模型，其表现始终优于仅分析孤立单句的模型。2025年，一种结合BERT文本嵌入、音频音高/语调分析及视频面部情绪识别的多模态系统，在讽刺检测准确率上超越了纯文本基线模型[9]。同样，2022年的一项研究通过关系图注意力网络将情感信息与依存图相结合，在六个基准数据集上超越了此前最先进水平，准确率提升最高达4.19%，F1值提升最高达4.33%[4]。这些结果表明，融入上下文——无论是来自前序话语、情感语调还是视觉线索——都能帮助机器捕捉到讽刺信号中的不协调性。

然而，上下文本身也带来了新的挑战。2025年的综述指出，不一致的上下文窗口化（即模型考虑多少先前对话内容）以及文化差异是尚未解决的主要问题[6]。一个基于英语Reddit讽刺语料训练的模型，在处理利比亚阿拉伯语Facebook帖子时可能表现不佳——2024年的一项研究显示，即便使用了手工构建的词汇和句法特征，支持向量机（SVM）模型的准确率也仅为79.15%[2]。即便在同一语言内部，方言差异也不容忽视：库尔德索拉尼语数据集（KuSarcasm）需要结合多语言BERT、语义相似度评分以及超过100条基于规则的 linguistic 模式，才能对16833条条目进行标注[10]。而2025年发布的三元孟加拉语数据集（BanglaSarc3）包含12089条评论，在讽刺、中立和非讽刺三个类别上均衡分布，其创建正是由于现有资源不足[11]。结论是：上下文虽有帮助，但也成倍增加了复杂性，没有任何单一模型能适用于所有语言或场景。

缺失的一环：理解立场与意图

一个更深层的局限在于，大多数讽刺检测系统忽略了作者的基本立场——即他们对话题是支持、反对还是保持中立。2022年的一项研究提出了“立场级讽刺检测”（SLSD），并表明通过BERT结合图注意力网络融入立场信息，能显著提升在中文数据集和SemEval-2018英文基准测试上的表现[12]。该研究指出，讽刺往往源于表达的情感与实际立场之间的错位（例如，在反对某个结果时却说“干得好！”），而捕捉这种隐藏的立场至关重要。其模型“以较大优势”超越了以往的基准方法，这表明现有系统缺失了一个关键的人类推理环节。

这种立场上的差异揭示了一个根本性的事实：机器可以学会将某些模式与讽刺联系起来，但它们并不推理意图。一篇2025年关于讽刺评论生成的研究使用微调的GPT-2模型生成讽刺文本，在某些情况下达到了与人类相当的逼真度[8]，但生成并不等同于理解。模型可以模仿讽刺，却并不明白其含义。正如2024年情感分析综述所指出的，先进的NLP模型（如CNN和RNN）能够捕捉讽刺、俚语等语境细微差别，但它们仍然是“黑箱”——我们只看到输出，却看不到推理过程[5]。可解释性工具（如LIME，即局部可解释模型无关解释）已被应用于孟加拉语讽刺检测，以展示哪些词汇驱动了决策[7]，但这揭示的是相关性，而非理解力。

本文引用的文献

SemIRNet：面向多模态讽刺检测的语义反讽识别网络

SemIRNet是一种融合文本、图像与常识知识的多模态模型，在讽刺检测基准测试中取得了88.87%的准确率和86.33%的F1分数，相较此前最优结果分别提升了1.64%和2.88%。

2025 · Jingxuan Zhou, Yuehao Wu, Yibo Zhang, Yeyubei Zhang, Yunchong Liu, Bolin Huang, Chunhong Yuan · 2025 10th International Conference on Information and Network Technologies (ICINT)

原文

使用自然语言处理技术检测利比亚阿拉伯方言中的讽刺表达

针对5082条Facebook评论的利比亚阿拉伯语讽刺检测，SVM模型达到了79.15%的准确率、79.3%的精确率、79.7%的召回率和79.5%的F1值。

2024 · Azalden Alakrot, Aboagela Dogman, Fathi Ammer · 2024 IEEE 4th International Maghreb Meeting of the Conference on Sciences and Techniques of Automatic Control and Computer Engineering (MI-STA)

原文

一种基于新型Transformer注意力机制的讽刺检测方法

UrduSarcasmNet采用级联分组多头注意力机制，在精心整理的乌尔都语推文数据集上表现优于简单注意力机制及当前最先进的模型。

2024 · Shumaila Khan, Iqbal Qasim, Wahab Khan, Khursheed Aurangzeb, Javed Ali Khan, Muhammad Shahid Anwar · Expert Syst. J. Knowl. Eng.

原文

情感增强的关系图注意力网络用于讽刺检测

一种融合情感与依存信息的增强型关系图注意力网络（ARGAT），在六个基准测试上相比先前方法将准确率提升了最高4.19%，F1分数提升了4.33%。

2022 · Guowei Li, Fuqiang Lin, Wangqun Chen, Bo Liu · Applied Sciences

原文

面向社交媒体情感分析的自然语言处理（NLP）技术

一项针对社交媒体情感分析中自然语言处理（NLP）的桌面综述发现，深度学习模型（如卷积神经网络、循环神经网络）能够捕捉讽刺和俚语，但仍属于“黑箱”模型，存在伦理与跨文化方面的不足。

2024 · Thomas Joseph · International Journal of Computing and Engineering

原文

对话语境中的讽刺检测：一项结合逻辑回归基线研究的综合评述

一项对15项讽刺检测研究的综述，结合基于Reddit数据的逻辑回归基线模型，实现了72.3%的准确率和0.75的ROC-AUC值，并指出上下文窗口化与文化偏见是主要挑战。

2025 · Jaipuneeth Jaishree Prabhu, Sai Preetham Rajappa Velur · Premier journal of science.

原文

使用BERT与可解释人工智能的可解释孟加拉语讽刺检测

基于BERT的孟加拉语讽刺检测器在新构建的Facebook/YouTube数据集（BanglaSarc）上达到了99.60%的准确率，远超传统机器学习方法的89.93%，并采用了LIME可解释性分析。

2023 · Ramisa Anan, Tasnim Sakib Apon, Zeba Tahsin Hossain, Elizabeth Antora Modhu, Sudipta Mondal, Md. Golam Rabiul Alam · CCWC

原文

使用自然语言处理生成讽刺评论

一个经过微调的GPT-2模型在3000条讽刺性提示语上训练后，生成了符合语境的讽刺评论，并通过困惑度指标和人工评估进行了验证。

2025 · Laxmi Kumari, Santosh Kumar Bharti · 2025 International Conference on Artificial Intelligence and Machine Vision (AIMV)

原文

基于自然语言处理的文本上下文感知讽刺检测

一种结合BERT/Word2Vec处理文本、音频音高/语调以及视频面部表情的多模态讽刺检测系统，相比纯文本模型显著提升了准确率。

2025 · Mrunal Deshmukh, Nilesh Joshi, Manisha Bharati · 2025 IEEE Pune Section International Conference (PuneCon)

原文

KuSarcasm：基于混合自然语言处理技术的讽刺数据集自动标注方法。

KuSarcasm是一个包含16,833条条目的库尔德语索拉尼方言数据集，利用mBERT、SBERT以及100多种基于规则的自动讽刺标注模式构建而成。

2025 · Shakhawan Aghajan, Rebwar M Nabi · Data in brief

原文

BanglaSarc3：一个用于从社交媒体检测孟加拉语讽刺的基准数据集，旨在推动孟加拉语自然语言处理的发展。

BanglaSarc3是一个包含12,089条Facebook评论（分为讽刺、中立、非讽刺三类）的三元数据集，为孟加拉语讽刺检测提供了均衡的基准。

2025 · Susmoy Biswas, Md Mostafizur Rahman Zahid, Mst Taposi Rabeya, Md Minhazul Abedin, Md Hasan Imam Bijoy, Md Sadekur Rahman · Data in brief

原文

基于BERT与立场中心图注意力网络的立场级讽刺检测

一个基于立场级别的讽刺检测框架（BERT结合以立场为中心的图注意力机制），通过建模作者立场，在中英文数据集上显著优于基线模型。

2022 · Yazhou Zhang, Dan Ma, Prayag Tiwari, Chen Zhang, Mehedi Masud, Mohammad Shorfuzzaman, Dawei Song · ACM Trans. Internet Techn.

原文