About Us
简介

Acemap是一个完全由国内自主研发的新式学术搜索系统。当前许多学术搜索系统以论文列表的形式返回学术搜索结果,导致学术数据散点化。针对这一缺陷,Acemap的创新性的将学术实体(包括论文、作者、机构等)组织成网络,通过网络分析和数据挖掘的方法,最终将这些实体的信息以图像的形式清晰、直观的方式展现出来,以帮助研究者的归纳整理现存的所有研究工作。

目前为止,Acemap已经实现了以下的功能:动态引用网络展示,论文聚类,学术族谱,研究者画像,作者和会议主页等等。

创立背景

当前学术搜索引擎(以 google scholar、百度学术为例),均基于关键词搜索为用户提供列表式结果,普遍缺少对学术数据的统合分析,导致学术数据碎片化。用户在使用过程中无法获得全局的完整学术信息,尤其是对于初涉某一领域的用户,在使用这类学术搜索引擎时,很难直观地了解一个学术领域。因此一个能够帮助用户整合、分析学术数据,帮助用户更加便捷的获取学术知识的系统迫在眉睫。一个对学术数据进行深度统合分析,并结合可视化技术来呈现学术领域关系图谱的学术搜索系统(Acemap)应运而生。

学术地图

示例1:开山领域星座图

以开山作为中心,构建自我(ego)引用网络,观察开山作影响下的文章分布和创新性。如以无线网络容量的开山作“The capacity of wireless networks”,以其为中心,刻画引用该开山作的文章之间的引用关系,节点的大小代表其影响力,由图可见,开山作左侧月牙形状的点聚集在一起,紧紧依附于红色节点,属于拓展型文章,创新度不够高,而另外的节点在开山作的指导下开创出蓝色和绿色两个领域,同时其中一些节点影响力较大,创新性较高。

示例2:database领域论文地图

不同于传统学术搜索引擎的论文列表的展现形式,Acemap将学术论文信息用地图的方式可视化出来,帮助学者了解论文之间的联系。如该图是关于database领域的论文的可视化地图,其中每个点代表一篇论文;点的颜色从蓝色到红色代表论文发表从老到新;点的大小代表论文的影响力。很有趣的是这个领域被分成了两个基本毫不相关的部分,左半边是计算机领域关于database技术的研究论文,右半边实际上是生物领域研究基因组、蛋白质等方向的论文,由于他们大量使用database,因此这些论文也带上了database的标签。在传统的搜索引擎中,这两种类型的论文也是会被混在一起,难以区分。但是借助论文地图的形式,这些论文之间的异同就很容易看出来了。

示例3:计算机领域星云图

这是对计算机领域顶级会议论文的可视化星云图,途中不同的颜色与聚类代表着计算机领域下不同子领域之间的关系。同时用户可以使用左侧菜单栏中的领域选择与回忆选择功能来对特定领域或者会议的文章进行高亮,帮助用户快速了解不同的领域或者会议之间的联系与区别。

示例4:会议对比图

在以往对会议的介绍分析中,多数只针对于一个会议,而极少有对于两个会议之间的研究与比较。即便是CCF同一领域下的推荐会议,也有着不同的研究方向和文章收录范围。而通过CCF会议对比图,用户可以轻松的了解到CCF同一领域下任意两个会议间的区别和联系。会议对比图包括会议作者对比图和会议论文对比图。会议作者对比图从两个会议中各选出影响力最大的学者,分别以红色和绿色的点表示,黄色的点则代表在两个会议中都发过文章的学者。点的大小代表该学者发表在这两个会议中的论文的总影响力,边则代表合作关系SIGMOD、VLDB、SIGIR均为CCF会议目录下“”数据库/数据挖掘/内容检索”类别的A类会议。从下面两图可以看出,SIGMOD和VLDB重合作者居多,可以推断出两个会议收录的文章的范围、类型相似,会议间作者的联系紧密。然而SIGMOD和SIGIR虽然在CCF会议目录下属于同一类,在两个会议中都发过文章的学者却几乎没有,可以推断出两个会议的类型和范围却不尽相同。

示例5:图灵50周年合作者地图

为了纪念图灵奖50周年,Acemap团队制作了图灵奖得主的合作者地图。具有按年份、领域、机构筛选的功能,直观地呈现各位图灵奖之间的关系。红色的点为图灵奖得主,绿色的小点为图灵奖得主的主要合作者。

会议图谱

为了方便研究人员快速了解会议的亮点,提升科研工作的效率,Acemap推出了会议图谱,功能主要包括参与会议的作者机构统计、机器解读论文、论文推荐、合作者关系图和Session图。

作者/机构统计

统计参与会议的机构和作者能帮助研究人员快速了解会议所属领域内工作突出的机构和个人。Acemap统计了会议当年、近三年、近五年机构和作者以第一作者或非第一作者身份发表论文的情况。同时根据发表机构所属国家,给出了各个国家在会议中的参与情况。Acemap针对参与会议的各个机构,也专门制作了机构在该会议中的专属页面,页面中包括了机构在会议中历年论文发表情况的统计页面。其中包括近年来该机构在会议中以第一作者和非第一作者分别发了多少文章以及具体有哪些作者发表了哪些文章,可以反映机构中的哪些作者在该会议中最活跃。

机器解读论文

一个会议的论文成百甚至上千,研究人员如果想要了解所有论文,可能需要花上许多时间和精力阅读论文。Acemap则用机器代替了人力。Acemap通过机器阅读理解,快速地抽取论文中最重要的信息,包括每篇论文研究了什么问题、提出了什么方法,生成我们的“一句话论文解读”,并做了机器自动翻译。这样,研究人员可以快速地浏览每篇论文的主要信息,筛选出自己感兴趣的论文。

论文推荐

无论是想快速了解一个领域、查阅某个领域相关的论文还是组织自己论文的参考文献,Acemap的论文推荐系统都能很好地帮助研究者完成以上工作。Acemap针对会议中的每篇论文,从多个维度推荐相似论文,其中包括最新论文推荐、同会议论文推荐、最相似论文推荐、被引量最高论文推荐、相关领域导读类论文推荐。其中最新论文推荐以及同会议论文推荐的价值得到多位学术大牛的肯定,对于他们的研究起到了帮助作用。最新论文推荐能帮助研究者掌握该领域最新动态的风向标,同会议论文推荐能帮助参与会议的学者结识志同道合的合作者。

合作者关系图

统计参与会议的机构和作者能帮助研究人员快速了解会议所属领域内工作突出的机构和个人。Acemap统计了会议当年、近三年、近五年机构和作者以第一作者或非第一作者身份发表论文的情况。同时根据发表机构所属国家,给出了各个国家在会议中的参与情况。Acemap针对参与会议的各个机构,也专门制作了机构在该会议中的专属页面,页面中包括了机构在会议中历年论文发表情况的统计页面。其中包括近年来该机构在会议中以第一作者和非第一作者分别发了多少文章以及具体有哪些作者发表了哪些文章,可以反映机构中的哪些作者在该会议中最活跃。

Session地图

一场国际会议往往分为多个Session,每个Session中的论文不仅在时间上相邻,在主题上也有相似度,但是Session之间的关系如何却不得而知。Acemap利用论文之间共同引用关系,给出了会议中各个Session之间的地图,直观凸显各个Session主题之间的内在联系,是一幅有趣且有意义的地图。图中每一个大点代表一个Session,大点周围的小点代表Session中的论文。Session之间的远近反映了Session之间关系的强弱。这样一张地图不仅帮助研究者更好地了解会议的全貌,也能更清晰地看出会议领域中不同主题间的联系以及Session的划分的合理性。

创始人介绍

王新兵,上海交通大学教授,博士生导师。ACM中国理事会副主席,上海交通大学特聘教授,电子信息与电气工程学院副院长,2013-2016年担任电子信息与电气工程学院院长助理。2011年-2013年担任上海交通大学电子工程系副系主任。上海交通大学John Hopcroft计算机科学中心执行主任。