要查找研究数据,请在学术论文末尾寻找专门的“数据可用性 (Data Availability)”声明,查阅研究方法 (Methodology) 部分,或检查补充材料中是否有指向外部存储库 (Repositories) 的链接。
找到已发表研究背后的原始数据 (Raw data) 或数据集 (Datasets) 对于验证研究结论、进行文献综述或复现实验至关重要。以下是一份关于具体查找位置的实用指南。
1. 定位数据可用性声明
目前,大多数现代学术期刊都要求作者提供数据可用性声明。该部分通常位于论文末尾、参考文献之前,明确说明原始数据是开放获取 (Open access)、可应要求提供 (Available upon request),还是因隐私问题而受限。它通常包含直接链接、获取编号 (Accession codes) 或 DOI 编号,以帮助您立即访问数据集。
2. 浏览研究方法和结果部分
如果论文没有具体的数据可用性声明,研究方法或结果 (Results) 部分将是您的下一个最佳选择。作者通常会在此处描述其数据收集方法,并可能提及数据集的托管位置。如果您很难在密集的 PDF 文件中找到隐藏的具体数据点,可以使用 WisPaper 的 Scholar QA 功能,直接提问数据在何处被提及,它会将答案追溯到确切的页码和段落。否则,您可以手动浏览正文,查找“dataset(数据集)”、“repository(存储库)”、“survey results(调查结果)”或“archive(档案)”等关键词。
3. 检查补充材料和附录
研究人员经常将大型数据集、代码和额外的表格作为补充文件 (Supplementary files) 附在文后,而不是将其塞入正文中。这些文件通常可以直接从期刊的发表页面下载,与论文主体的 PDF 文件是分开的。请务必检查论文附录 (Appendices) 或出版商网站,寻找包含原始数据的 zip 压缩包、CSV 或 Excel 表格。
4. 搜索学术数据存储库
作者通常会将研究数据上传至第三方存储库,以确保数据的长期保存并符合资助机构的要求。如果您知道某篇论文使用了开放数据,但在正文中找不到链接,请尝试在常用的学术数据存储库中搜索作者姓名或研究标题:
- Zenodo 或 Figshare:适用于多学科数据集。
- Dryad:适用于生命科学、生态学和医学研究。
- GitHub:适用于计算模型、算法和数据科学代码。
- Google Dataset Search:适用于在全网范围内进行广泛检索。
5. 联系通讯作者
如果数据未公开提供,您可以直接联系通讯作者 (Corresponding author)。他们的电子邮件地址通常会列在论文的首页。请保持邮件简明扼要,说明您的研究为何需要这些数据,并礼貌地询问他们是否愿意分享一份数据集的副本。
