要在参考文献中正确引用数据集,您需要找到可靠的数据存储库 (data repositories),提取作者和 DOI 等核心元数据 (metadata),并根据您所需的学术引用格式对这些信息进行排版。
数据集正日益被视为主要的原始研究成果 (primary research outputs),这意味着对它们的引用必须像传统期刊文章一样严谨。然而,由于原始数据 (raw data) 并不总是像同行评审 (peer-reviewed) 论文那样以标准化的方式发布,因此在为参考文献列表收集准确信息时,可能会让人感到困惑。
以下是一份为您的研究查找、追踪和引用数据集的实用指南。
1. 从可靠的数据存储库获取数据
只要条件允许,请尽量从公认的学术或机构存储库 (institutional repositories) 中获取数据,而不是使用个人网站。像 Figshare、Dryad、Zenodo、Harvard Dataverse 以及政府门户网站(如 data.gov)等平台,会为其文件分配永久标识符 (permanent identifiers)。这使得数据更容易被追踪,也能在您的参考文献中被准确引用。
2. 提取核心元数据
要构建完整的参考文献条目,您需要在数据集的着陆页 (landing page) 上找到特定的元素。请务必查找以下信息:
- 作者/创建者 (Author/Creator): 收集整理该数据的首席研究员 (principal investigator)、研究团队或组织机构。
- 发布年份 (Publication Year): 数据集正式发布或公开提供的年份。
- 标题 (Title): 数据集的正式名称。
- 发布者 (Publisher): 托管该文件的存储库或档案馆。
- 标识符 (Identifier): 数字对象唯一标识符 (DOI) 或永久 URL。这是学术引用中最关键的信息。
3. 追踪版本与访问日期
与静态的研究论文不同,数据集经常会被更新、修正或扩充。请务必记录您所下载数据的具体版本号。如果存储库未提供版本号或 DOI,您必须记录访问和下载该文件的确切日期,以确保您的研究保持可重复性 (reproducible)。
4. 采用正确的引用格式
不同的学术规范(如 APA、MLA 或芝加哥格式)对数据参考文献的排版都有其独特的规则。在大多数情况下,您需要在标题后紧跟一个方括号内的描述——例如“[Data set]”(数据集)或“[Unpublished raw data]”(未发布的原始数据)——以便向读者说明来源类型。由于手动排版这些繁杂的来源可能非常繁琐,使用 WisPaper 的 TrueCite 功能可以自动查找并验证您的引用,确保格式正确,同时消除虚构引用 (hallucinated references) 的风险。
5. 保持参考文献井然有序
不要等到写作过程结束时才去整理数据集链接。请像对待文献参考一样对待数据集:在决定使用它们的那一刻,就将其添加到您的文献管理软件 (reference manager) 中。尽早保存元数据和 DOI 可以防止您遗失来源信息,并让最终参考文献目录的生成过程变得顺畅无缝。
