2亿篇论文免费看!「微软学术」停用,OpenAlex要接班

简介: 2亿篇论文免费看!「微软学术」停用,OpenAlex要接班

【新智元导读】为了接替已下线的「微软学术搜索」,大型免费学术索引OpenAlex已于今年年初正式上线,它涵盖2亿篇科学文献,易学易用,完全免费,网站将于2月上线。


最近,大型免费学术资源索引OpenAlex宣布上线,该索引包含超过 2 亿份科学文献。

 

 

这个资源索引服务名为OpenAlex,源自古代埃及亚历山大图书馆馆名。

 

创始人表示,该索引对出版物来源、作者信息和研究主题进行编目,旨在绘制这些数据点之间的联系,以创建一个全面的、相互关联的全球研究系统数据库。

 

 

去年 5 月,微软宣布将于当年年底关闭学术搜索知识图谱(MAG) ,让一些学者和其他使用其数据进行研究和开发的人感到担忧。

 

 

为应对 MAG 的下线,位于加拿大温哥华的非营利性学术服务公司 OurResearch利用伦敦慈善机构 Arcadia Fund 提供的 450 万美元的一部分,创建了这项「伟大工程」。

 

今年1月3日推出的这个免费学术索引数据库,功能上与微软的Academic Graph (MAG) 类似,MAG 是Scopus、Dimensions 和 Web of Science 等学术订阅平台的免费替代品,已于 2021 年底停止运营。

 

据悉,该索引当前通过可执行复杂搜索的应用程序编程接口或 API 访问。

 

微软「学术图谱」接班人

无论是研究人员,还是开发者,都需要大量查阅论文、专著等学术成果。近年来,越来越多的人开始绕过学术出版商的「付费墙」,通过多种手段免费获取学术资源。

 

作为微软MAG的替代品,此前OpenAlex一直在从MAG获得论文、作者和其他数据实体。在MAG正式停止运营后,OpenAlex开始自己从互联网收集更多新内容。

 

目前OpenAlex已经发布新的 REST API 。与之前下载安装的方式相比,可以更快、更简单地访问 OpenAlex 数据库,无需账户和令牌,完全免费。

 

 

目前,通过API可以获取单一实体、实体列表和实体组。

 

 

OpenAlex数据集描述了5类学术实体以及这些实际之间的联系。每类实体分别对应其目标:

 

成果:包括论文、书籍、数据集等,会引用其他成果

作者:做出成果的人

出处:刊载成果的期刊或资源库

机构:(通过作者)与成果相关的大学或其他组织

概念:以话题方式对成果进行标签

 

OpenAlex表示,探索 OpenAlex 数据集的最简单方法是通过 Web 界面,无需编写代码即可探索 OpenAlex。不过目前网站开发尚未完成,预计在今年2月上线。

 

 

尽管MAG已停用,但作为其继任者和替代,OpenAlex将继续维护MAG格式至今年7月2日,从2022年7月起,OpenAlex将不再支持MAG格式。

 

由于目前尚处于早期开发阶段,各项功能尚待进一步完善,OpenAlex将每日单个用户调用数量限制在10万次以下。

 

OpenAlex三大优势

在综合比较各种数据库之后,小编发现,OpenAlex具有明显的三大优势,这将带给用户美好的体验。

 

海量数据,覆盖面超MAG

 

OurResearch的联合创始人贾森•普里姆(Jason Priem)表示,「OpenAlex的创立是为了实现与其他几个数据库互联互通,使其覆盖更加广泛全面。」

 

与某个单一数据库相比,OpenAlex拥有更加开放的获取覆盖面,它拥有来自Wikidata 标识符、MAG 、ORCID、Crossref、ROR、Unpaywall等数据资源。

 

普里姆表示,「我们不仅可以给用户提供文章的免费版本,还可以告诉你该文章的授权和不同版本。」

 

 

简单易用,20分钟就会


「OpenAlex是在用一种聪明的方式,将大量的数据库整合在一起。」欧弗顿公司(Overton)的创始人尤安•阿迪(Euan Adie)说。

 

欧弗顿是家总部位于伦敦的公司,主要用于跟踪政策文件的引用。过去,欧弗顿公司从不同的来源获取数据,包括MAG、ORCID、Crossref,也直接向个人获取。

 

现在,欧弗顿只使用OpenAlex,寄希望于检索过程更加便捷,简单设置让人容易学会。

 

「我只需要20分钟就会使用OpenAlex,而对比MAG却要3-4天。」阿迪说。

 

 

「我花了大约2小时就学会了OpenAlex,而开始用MAG却要一周。」另一位使用者Roar Bakken Stovner说。

 

Stovner认为,对于更精通计算机的人来说,MAG可能不算难,而对于那些想要自己尝试开发小项目的人来说,OpenAlex将更容易开始。

 

不用登录,完全免费

 

OpenAlex的底层代码在CC0版权许可下可以免费获得,任何人都可以在其上进行开发。

 

因此,贾森·普里姆(Jason Priem)表示,OpenAlex每两周更新一次,比MAG更向前迈进了一步。

 

假如,哪一天OpenAlex停止运行,那么,任何人都可以从接着Priem停下的进度继续开发,而不必从头开始搭建数据库。

 

此前,MAG的用户必须登录系统,并支付少量费用,才可以下载。而OpenAlex可以免费使用。

 

普里姆表示,这要感谢Amazon Web Services的赞助,不需要注册或登录,这使得使用过程更加友好。

 

不过,OpenAlex可能会考虑为那些想要超快访问的用户,推出付费高级版本。

 

但,免费的版本总是可用的。

 

 

参考资料:https://www.nature.com/articles/d41586-022-00138-yhttps://www.nature.com/articles/d41586-022-00103-9https://docs.openalex.org/

相关文章
|
XML Java API
SpringBoot3.x日志生产最佳实践原来是这样!
SpringBoot3.x日志生产最佳实践原来是这样!
704 0
|
7月前
|
人工智能 搜索推荐 小程序
AI故事随心绘:多主体ID保留,个性化生成
近期通义实验室提出了一种AnyStory的方法,旨在实现高质量的个性化文本到图像生成,支持单个和多个主体。
239 1
|
存储 安全 网络性能优化
交换机学习以及介绍
【10月更文挑战第1天】
466 4
|
消息中间件 canal 数据采集
Flink CDC 在货拉拉的落地与实践
陈政羽在Apache Asia Community Over Code 2024上分享了《货拉拉在Flink CDC生产实践落地》。文章介绍了货拉拉业务背景、技术选型及其在实时数据采集中的挑战与解决方案,详细阐述了Flink CDC的技术优势及在稳定性、兼容性等方面的应用成果。通过实际案例展示了Flink CDC在提升数据采集效率、降低延迟等方面的显著成效,并展望了未来发展方向。
932 14
Flink CDC 在货拉拉的落地与实践
|
资源调度 前端开发 数据可视化
构建高效的数据可视化仪表板:D3.js与React的融合之道
【10月更文挑战第25天】在数据驱动的时代,将复杂的数据集转换为直观、互动式的可视化表示已成为一项至关重要的技能。本文深入探讨了如何结合D3.js的强大可视化功能和React框架的响应式特性来构建高效、动态的数据可视化仪表板。文章首先介绍了D3.js和React的基础知识,然后通过一个实际的项目案例,详细阐述了如何将两者结合使用,并提供了实用的代码示例。无论你是数据科学家、前端开发者还是可视化爱好者,这篇文章都将为你提供宝贵的洞见和实用技能。
377 5
|
开发框架 数据可视化 编译器
Qt的魅力:探索跨平台图形界面开发之旅
Qt的魅力:探索跨平台图形界面开发之旅
351 1
|
SQL Oracle 关系型数据库
实时计算 Flink版操作报错合集之连接器换成2.4.2之后,mysql作业一直报错如何解决
在使用实时计算Flink版过程中,可能会遇到各种错误,了解这些错误的原因及解决方法对于高效排错至关重要。针对具体问题,查看Flink的日志是关键,它们通常会提供更详细的错误信息和堆栈跟踪,有助于定位问题。此外,Flink社区文档和官方论坛也是寻求帮助的好去处。以下是一些常见的操作报错及其可能的原因与解决策略。
510 3
|
存储 NoSQL Ubuntu
看懂GDB调试核心:剖析ptrace原理及其应用场景!(中)
看懂GDB调试核心:剖析ptrace原理及其应用场景!
|
JSON JavaScript 前端开发
自动把Excel转Json格式数据
在实际工作中,我们常常使用Excel记录各种数据,但在各种应用系统传输数据却使用JSON格式,这就需要把Excel转为JSON。如果能把数据转换传输过程自动化就更完美了。
656 1
自动把Excel转Json格式数据
|
前端开发 区块链
Web3年入百万的“空投”到底是什么?教你开发批量转账的空投DApp(涵盖前端、智能合约)
Web3年入百万的“空投”到底是什么?教你开发批量转账的空投DApp(涵盖前端、智能合约)
1209 0