面向开源软件项目的软件知识图谱构建方法

TP301; 软件复用是软件开发中避免重复劳动的解决方案.开源软件的源代码、邮件列表、缺陷报告和问答文档等软件资源中蕴含了规模庞大、结构复杂、语义关联丰富的软件知识.如何获取知识、组织知识,以及如何在软件复用过程中方便地检索软件知识是亟待解决的问题.为了解决这些问题,面向开源软件项目,构建了软件知识图谱,并提供了基于软件知识图谱的软件知识检索.主要工作包括:针对4种不同类型的软件资源,提出了软件知识实体的提取原则与方法;提出了软件知识实体之间关联关系构建的方法;实现了两种软件知识检索机制,并以文字列表和图形可视化相结合的方式展现检索结果;设计了软件知识图谱构建框架.基于上述工作,设计并实现了一...

Full description

Saved in:
Bibliographic Details
Published in计算机科学与探索 Vol. 11; no. 6; pp. 851 - 862
Main Authors 李文鹏, 王建彬, 林泽琦, 赵俊峰, 邹艳珍, 谢冰
Format Journal Article
LanguageChinese
Published 北京大学(天津滨海)新一代信息技术研究院,天津 300450 2017
高可信软件技术教育部重点实验室,北京 100871
北京大学 信息科学技术学院,北京 100871
Subjects
Online AccessGet full text
ISSN1673-9418
DOI10.3778/j.issn.1673-9418.1609026

Cover

More Information
Summary:TP301; 软件复用是软件开发中避免重复劳动的解决方案.开源软件的源代码、邮件列表、缺陷报告和问答文档等软件资源中蕴含了规模庞大、结构复杂、语义关联丰富的软件知识.如何获取知识、组织知识,以及如何在软件复用过程中方便地检索软件知识是亟待解决的问题.为了解决这些问题,面向开源软件项目,构建了软件知识图谱,并提供了基于软件知识图谱的软件知识检索.主要工作包括:针对4种不同类型的软件资源,提出了软件知识实体的提取原则与方法;提出了软件知识实体之间关联关系构建的方法;实现了两种软件知识检索机制,并以文字列表和图形可视化相结合的方式展现检索结果;设计了软件知识图谱构建框架.基于上述工作,设计并实现了一个面向开源软件项目的软件知识图谱构建工具.实例证明,所构建的软件知识图谱可以更好地帮助软件开发人员进行软件知识的检索与应用.
ISSN:1673-9418
DOI:10.3778/j.issn.1673-9418.1609026