Serendipity by Design: Evaluating the Impact of Cross-domain Mappings on Human and LLM Creativity

WisPaper

Scholar Search

Scholar QA

Pricing

TrueCite

Workspace

Home

Blog

Serendipity by Design: Evaluating the Impact of Cross-domain Mappings on Human and LLM Creativity

[研报] 跨域映射：为什么 LLM 天生比你更有“脑洞”？

Summary

Problem

Method

Results

Takeaways

Abstract

本文探讨了“跨域映射”（Cross-domain Mapping）对人类与大语言模型（LLM）创造力的影响。研究通过对比随机远程领域启发与常规用户需求启发，发现 LLM（如 o3, Claude 3.5）在创意原创性上普遍超越人类，但人类更能从跨域干预中显著获益。

TL;DR

即使是随机的“跨域类比”（如：把章鱼的特性用到汽车设计上）也能让普通人的创造力大幅提升，但对大语言模型（LLM）来说，这种干预几乎是多此一举。普林斯顿大学的最新研究显示，LLM 在创意原创性上已经全线碾压人类，且它们本身就在以一种“全域联想”的模式运行。

背景定位：创造力可以被“工程化”吗？

历史上许多伟大的发明都源于偶然的跨域观察，比如魔术贴（Velcro）模仿了植物刺果的钩状结构。这种通过**跨域映射（Cross-domain Mapping）**寻找灵感的过程，在认知心理学中被视为突破“功能固着”的关键。本研究试图回答：当我们将这种“机缘巧合”工业化、变成提示词（Prompt）时，人类和 LLM 谁会更胜一筹？

痛点深挖：人类的“思维定势” vs AI 的“全局视野”

人类在创新时往往被局限在窄窄的语义邻域内。如果你要改进一个背包，你首先想到的是增加口袋或换个材料（User-need 模式）。

人类瓶颈：难以跳出舒适区，除非被强制要求（如：想想仙人掌和背包有什么关系）。
LLM 优势：训练数据横跨百科全书，其隐含的“联想分层”更平坦，天生就具备寻找远程关联的能力。

方法论详解：如何量化“脑洞”的距离？

研究者不仅对比了人类和 LLM（o3, GPT-4o, Claude 等）的表现，还引入了一个硬核指标：语义距离。

1. 实验设计

参与者需要为 10 种日常产品（如电视、沙发、背包）提供创新方案。

干预组：随机分配一个毫不相关的源域（如：政府、龙卷风、咸菜）。
对照组：直接根据用户需求构思。

2. 算力背书的语义分析

作者利用 Wikipedia 文本的 Embedding 分布计算了源域与目标域之间的 Jensen–Shannon 散度。简单来说，分布重合度越低，说明这两个概念在人类知识图谱中距离越远，映射难度也就越高。

模型架构与实验示意 图 1：人类（绿色）在跨域提示下原创性显著提升，而 LLM（橙色）无论哪种提示都保持高水准。

实验结果：AI 赢了平均分，人类赢了“疯子天才”

核心结论非常有意思：

平均值的碾压：LLM（尤其是 o3 和 Claude-Sonnet-4）生成的点子在“原创性”上显著高于人类。
干预的非对称性：跨域映射对人类是“大力出奇迹”，原创性大幅跳水式增长；对 LLM 则是“波澜不惊”，因为它们似乎随时都在进行这种映射。
语义距离即正义：无论对谁，源域越远（比如从“咸菜”映射到“汽车”），产生的点子通常越被认为具有原创性。

语义距离与原创性关系图 图 2：展现了跨域映射下，原创性随语义距离增加而上升的趋势。

深度洞察：原创性 vs 投资价值

研究发现了一个残酷的现实：原创性（Originality）与可行性（Feasibility）呈强负相关（r = -0.74）。

LLM 经常给出极其前卫但难以实现的点子（如：利用微型盐水胶囊自动修复划痕的“咸菜汽车”）。
投资价值（Investment Worthiness） 实际上更多地取决于 有用性（Usefulness），而非脑洞有多大。

资深主编点评

这篇论文为“AI 替代论”提供了一个新的视角：在创意生成的初期阶段（Ideation），LLM 已经是一个比绝大多数人类更高效的“跨域联想机器”。

局限性分析：目前的 LLM 在跨域映射时更倾向于功能性/机制性的迁移（如：把仙人掌的储水机制搬给背包），而人类则更倾向于感知/感官的迁移（如：给背包加点刺）。这暗示了 LLM 在理解人类心理偏好和审美联想方面仍有欠缺。

未来展望：创造力不是一次性的输出，而是迭代的过程。未来的杀手级应用可能是：由人类提供感性的审美方向，由 AI 在万亿级的多学科知识库中进行“语义远征”，寻找那些虽然遥远但由于技术进步正变得“可行”的跨域映射方案。

Find Similar Papers

Try Our Examples

查找最近关于大语言模型在发散性思维（Divergent Thinking）任务中与人类创意专家对比的研究论文。
在哪篇论文中首次定义了衡量语义距离的 Jensen–Shannon 散度方法，并在创造力测评中得到应用？
有哪些研究探讨了如何通过迭代提示（Iterative Prompting）或自我批判（Self-Critique）来进一步提升 LLM 的实际投资价值（Investment Worthiness）？

Contents

[研报] 跨域映射：为什么 LLM 天生比你更有“脑洞”？

1. TL;DR

2. 背景定位：创造力可以被“工程化”吗？

3. 痛点深挖：人类的“思维定势” vs AI 的“全局视野”

4. 方法论详解：如何量化“脑洞”的距离？

4.1. 1. 实验设计

4.2. 2. 算力背书的语义分析

5. 实验结果：AI 赢了平均分，人类赢了“疯子天才”

6. 深度洞察：原创性 vs 投资价值

7. 资深主编点评