关于网页抓取:下载所有发布的摘要

Download all pubmed abstracts

有人知道我可以轻松下载所有发表的文章摘要吗?我正在做一个文本挖掘项目。

我能找到的最接近的摘要一次只能下载一个摘要,但这对我来说太慢了,因为我必须一次下载一个摘要。


n


n


我将使用Europe PMC提供的RESTful API。他们允许每个查询以json或xml格式下载25篇文章。有关疟疾的文章的示例查询如下所示:

  • http://www.ebi.ac.uk/europepmc/webservices/rest/search/query=malaria


    n