Google Scholar:走过风雨十年——听创始人畅谈苦辣酸甜

2014-11-24 09:15 · 李亦奇

11月18日,是站在巨人的肩膀上的Google Scholar的开源文献搜索10周年,十年来,她服务了数以万计的科研工作者。那么作为一个以营利为主要目的谷歌公司,Google Scholar是怎么赚钱的呢?

Google Scholar,作为一个免费的学术图书馆,在11月8日即将迎来她的开源十周年庆。

她通过爬虫工具网页采集了数以百万计的学术文献(包括一些付费文献),改变了科研工作者传统的学术文献检索方式。

根据Nature杂志的调查统计,全世界60%的研究者会定期上Google Scholar检索他们所学的文献,Nature采访了Google Scholar的联合开发者Anurag Acharya,他不仅分享了Google Scholar的过去,还谈到了Google Scholar的未来。

Q:你怎么知道检索什么文献?

“Scholar”在学术领域是其他人认为学术。 这听起来就像一个递归定义但它安定下来。 我们是对整个web爬行,包括新的博客,如果您看看连接的各类文献,你已经知道。 如果许多人引用它,或者它引用了许多人来说,它可能是学术。 没有一个神奇的公式:你把证据指向从许多特性。

Q:谷歌学术搜索的想法是从哪里来的?

2000年,我从圣巴巴拉市的加州大学来到谷歌工作。 很显然,我不太可能产生比在Google(Scholar)更大的影响——使世界各地的人们能够找到信息。

所以我放弃了学术并和谷歌索引团队合作了四年。 这是一个非常忙碌的时间,基本上我快累坏了。

于是索引团队的同事Alex Verstak和我决定采取休假6个月,并尽量寻找学术文章更容易和更快。这个想法最初不是生产谷歌学术搜索,它是为了提高我们的学术文献在网络搜索排名。我们试图这样做的问题是找出搜索用户的搜索目的。他们是真心想要学术结果or他们是外行吗? 

我们认为:假设你没有努力解决这个问题,你永远不知道搜索学术意图。

Q:这是一个持续的成功吗?

它非常受欢迎。 Google Scholar启用后,使用量呈指数级增长使用指数级的增长。 一个重大的区别是,我们相关排序(排序结果与用户的请求),之前没有做学术搜索服务。 一个重要的差别在于我们按照与用户请求的相关性排列搜索结果,这是此前的学术性搜索服务无法做到的。他们是第一时间采取逆时(倒序)方式提供最新的结果。 我们爬的全文研究的文章,虽然我们不包括全文的出版商当我们开始。

Q:2012年,谷歌学术从谷歌主页搜索选项的下拉式菜单中消失。你是否担心谷歌学术的地位可能下降或者被砍掉?

不会担心。我们的团队在不断成长中,从成立之初的两个人发展到现在的9人。很多人或许会将谷歌学术从首页菜单中的撤销看成是一种降级,但事实并非如此。这些菜单链接是为了帮助用户从主页转到其他服务,因此会突出那些使用最多的转换链接。如果用户已经知道如何启动谷歌学术,他们就不需要那种转换链接。就是这样而已。

Q:Google Scholar如何赚钱?

Google Scholar目前不赚钱。 目前谷歌有很多服务都不赚钱。Google Scholar的主要作用是研究社区,收集回馈。我们能够这样做是因为从谷歌的立场它不是很贵。

就检索查询而言,谷歌学术搜索比谷歌其他很多服务的范围小很多,所以广告盈利的机会相对较小。不过幸运的是我们没有盈利的压力。越来越多的人喜欢Google Scholar的内容服务,这在某种程度上已经超越了学术本身。

Q:未来谷歌学术会有什么样的改变?

我们非常擅长帮助用户找到他们要搜索的文章。不过,下一步我们打算做的一件大事是帮助用户找到他们需要但又不知如何搜索的文章。我们能否让意外发现变得更加容易?如何帮助每个人在无须翻阅上百篇论文导致一整天任何其他事都干不了的情况下,轻松掌握学术前沿?

我不知道我们将如何实现这个目标。尽管在这方面我们已经做了一些初步努力如推出建议搜索引擎,但离想要的东西还相去甚远。在向用户推送不是其主动搜索的信息时,存在一个本质性问题:内容必须具有相关性,确保我们没有浪费用户时间,但又不能太相关,因为用户已经知道这些文章。

Q:人们应该使用谷歌学术搜索数据隐私的担忧吗?

我们使用根据相关标准的进行谷歌数据收集策略——与其他学术检索没有什么不同。 我在谷歌的角色主要都集中在谷歌学术搜索。所以我不能说更多关于更广泛的问题。