Google Scholar,作为一个免费的学术图书馆,在11月8日即将迎来她的开源十周年庆。
她通过爬虫工具网页采集了数以百万计的学术文献(包括一些付费文献),改变了科研工作者传统的学术文献检索方式。
根据《自然》(Nature)杂志的调查统计,全世界60%的研究者会定期上Google Scholar检索他们所学的文献,Nature采访了Google Scholar的联合开发者Anurag Acharya,他不仅分享了Google Scholar的过去,还谈到了Google Scholar的未来。
Q:你怎么知道检索什么文献?
“Scholar”在学术领域是其他人认为学术。 这听起来就像一个递归定义但它安定下来。 我们是对整个web爬行,包括新的博客,如果您看看连接的各类文献,你已经知道。 如果许多人引用它,或者它引用了许多人来说,它可能是学术。 没有一个神奇的公式:你把证据指向从许多特性。
Q:谷歌学术搜索的想法是从哪里来的?
2000年,我从圣巴巴拉市的加州大学来到谷歌工作。 很显然,我不太可能产生比在Google(Scholar)更大的影响——使世界各地的人们能够找到信息。
所以我放弃了学术并和谷歌索引团队合作了四年。 这是一个非常忙碌的时间,基本上我快累坏了。
于是索引团队的同事Alex Verstak和我决定采取休假6个月,并尽量寻找学术文章更容易和更快。这个想法最初不是生产谷歌学术搜索,它是为了提高我们的学术文献在网络搜索排名。我们试图这样做的问题是找出搜索用户的搜索目的。他们是真心想要学术结果or他们是外行吗?
我们认为:假设你没有努力解决这个问题,你永远不知道搜索学术意图。
Q:这是一个持续的成功吗?
它非常受欢迎。 一旦我们启动,使用指数级的增长。 一个重大的区别是,我们相关排序(排序结果与用户的请求),之前没有做学术搜索服务。 他们是逆时提供最新的结果第一。 我们爬的全文研究的文章,虽然我们不包括全文的出版商当我们开始。
Q:Google Scholar如何赚钱?
Google Scholar目前不赚钱。 目前谷歌有很多服务都不赚钱。Google Scholar的主要作用是研究社区,收集回馈。我们能够这样做是因为从谷歌的立场它不是很贵。
就检索查询而言,谷歌学术搜索比谷歌其他很多服务的范围小很多,所以广告盈利的机会相对较小。不过幸运的是我们没有盈利的压力。越来越多的人喜欢Google Scholar的内容服务,这在某种程度上已经超越了学术本身。
Q:人们应该使用谷歌学术搜索数据隐私的担忧吗?
我们使用根据相关标准的进行谷歌数据收集策略——与其他学术检索没有什么不同。 我在谷歌的角色主要都集中在谷歌学术搜索。所以我不能说更多关于更广泛的问题。