计算机科学与技术学科网络安全与优化研究所学术报告(傅洛伊 上海交通大学)
学科建设与研究生办 2019-12-20 44

报告题目:知识亦有结构:学术大数据空间知识发现与知识度量

报 告 人:傅洛伊 特别副研究员

报告时间:2019年12月23日(星期一)下午14:00-15:30

报告地点:21幢3楼第三会议室

报告内容:长期以来,人类对于知识的认知始终流于表面,缺乏有效的、可解释的度量方法。以学术大数据领域为例,尽管近年来学术数据库的不断完善丰富了对学术网络的研究,但如何对学术实体进行知识感知与测度始终未得到有效解答。知识本身作为抽象的、哲学般存在的概念,其所依赖的大数据实体间其实蕴含着丰富的内在结构特征。事实上,这种结构本身对于知识的解释有着深刻而复杂的意义,但从未被充分挖掘。有鉴于此,我们相继从定性和定量两个角度出发,首次对知识载体之间形成的复杂结构进行了抽取和度量。首先,从定性角度上,我们创新性地提出了“领域脉络树”的概念,设计了相应的脉络树提取算法有效抽取出不同学术领域的主干结构,揭示出学术网络的主线发展脉络,并依据其性质的不同,分别定性归纳不同类别发展脉络的独特性质,分析其背后成因;继而,从定量角度上,我们基于所抽取的脉络树,首次引入了“知识熵”的概念来度量脉络树中的节点学术价值,并给出了知识熵的计算方法,将其扩展到了互知识熵和条件知识熵等内容。在此基础上,我们将文章的影响力和知识量分别以“树熵”和“点熵”的形式加以量化,定量地刻画学术网络中学术实体的知识量,为知识这一抽象概念提供了基于结构的有效度量方式。上述机理和方法进一步应用在12个代表性学术文章、3篇经典学术专著以及nature、science刊物发表文章及其引文所分别构成的学术网络星云图中。实验结果验证了我们所设计的脉络树提取算法与知识熵计算对于任意学术领域知识量化的通用性,并帮助我们揭开了不同领域中的各类有趣现象。




邀请人:贾日恒