Google Scholar十周年:站在巨人的肩膀上 ​

2014-11-13 16:15 来源:生物360 作者:koo
字体大小
- | +

Google Scholar,作为一个免费的学术图书馆,在11月8日即将迎来她的开源十周年庆。

她通过爬虫工具网页采集了数以百万计的学术文献(包括一些付费文献),改变了科研工作者传统的学术文献检索方式。

根据《自然》(Nature)杂志的调查统计,全世界60%的研究者会定期上Google Scholar检索他们所学的文献,Nature采访了Google Scholar的联合开发者Anurag Acharya,他不仅分享了Google Scholar的过去,还谈到了Google Scholar的未来。

Q:你怎么知道检索什么文献?

“Scholar”在学术领域是其他人认为学术。 这听起来就像一个递归定义但它安定下来。 我们是对整个web爬行,包括新的博客,如果您看看连接的各类文献,你已经知道。 如果许多人引用它,或者它引用了许多人来说,它可能是学术。 没有一个神奇的公式:你把证据指向从许多特性。

Q:谷歌学术搜索的想法是从哪里来的?

2000年,我从圣巴巴拉市的加州大学来到谷歌工作。 很显然,我不太可能产生比在Google(Scholar)更大的影响——使世界各地的人们能够找到信息。

所以我放弃了学术并和谷歌索引团队合作了四年。 这是一个非常忙碌的时间,基本上我快累坏了。

于是索引团队的同事Alex Verstak和我决定采取休假6个月,并尽量寻找学术文章更容易和更快。这个想法最初不是生产谷歌学术搜索,它是为了提高我们的学术文献在网络搜索排名。我们试图这样做的问题是找出搜索用户的搜索目的。他们是真心想要学术结果or他们是外行吗?

我们认为:假设你没有努力解决这个问题,你永远不知道搜索学术意图。

Q:这是一个持续的成功吗?

它非常受欢迎。 一旦我们启动,使用指数级的增长。 一个重大的区别是,我们相关排序(排序结果与用户的请求),之前没有做学术搜索服务。 他们是逆时提供最新的结果第一。 我们爬的全文研究的文章,虽然我们不包括全文的出版商当我们开始。

Q:Google Scholar如何赚钱?

Google Scholar目前不赚钱。 目前谷歌有很多服务都不赚钱。Google Scholar的主要作用是研究社区,收集回馈。我们能够这样做是因为从谷歌的立场它不是很贵。

就检索查询而言,谷歌学术搜索比谷歌其他很多服务的范围小很多,所以广告盈利的机会相对较小。不过幸运的是我们没有盈利的压力。越来越多的人喜欢Google Scholar的内容服务,这在某种程度上已经超越了学术本身。

Q:人们应该使用谷歌学术搜索数据隐私的担忧吗?

我们使用根据相关标准的进行谷歌数据收集策略——与其他学术检索没有什么不同。 我在谷歌的角色主要都集中在谷歌学术搜索。所以我不能说更多关于更广泛的问题。

查看信源地址

编辑: zhongguoxing

版权声明

本网站所有注明“来源:丁香园”的文字、图片和音视频资料,版权均属于丁香园所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明“来源:丁香园”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。同时转载内容不代表本站立场。

  • App下载