基于MacBERT-BiLSTM-CRF模型的继电保护装置缺陷知识图谱构建方法

电网发展至今积累了大量继电保护装置缺陷文本数据,尚未被有效挖掘利用.此外,继电保护装置的缺陷排除工作过度依赖运行人员的专业能力,现场运维工作难度大.针对上述问题,提出基于MacBERT-BiLSTM-CRF模型的继电保护装置缺陷知识图谱构建方法.首先,分析继电保护装置缺陷文本的记录特点,对非结构化文本进行数据清洗、数据标注以及数据增强处理.其次,基于BERT-BiLSTM-CRF模型构建MacBERT-BiLSTM-CRF模型进行实体抽取任务.然后,定义继电保护装置缺陷文本的关系抽取规则,结合实体抽取模型共同完成关系抽取任务.最后,构建继电保护装置缺陷知识图谱的模式层,并利用Neo4j图数据库...

Full description

Saved in:
Bibliographic Details
Published in电力系统保护与控制 Vol. 52; no. 20; pp. 131 - 143
Main Authors 戴志辉, 张富泽, 张近月, 韩笑
Format Journal Article
LanguageChinese
Published 河北省分布式储能与微网重点实验室(华北电力大学),河北 保定 071003%华北电力大学控制与计算机工程学院,河北 保定 071003 16.10.2024
Subjects
Online AccessGet full text
ISSN1674-3415
DOI10.19783/j.cnki.pspc.240008

Cover

More Information
Summary:电网发展至今积累了大量继电保护装置缺陷文本数据,尚未被有效挖掘利用.此外,继电保护装置的缺陷排除工作过度依赖运行人员的专业能力,现场运维工作难度大.针对上述问题,提出基于MacBERT-BiLSTM-CRF模型的继电保护装置缺陷知识图谱构建方法.首先,分析继电保护装置缺陷文本的记录特点,对非结构化文本进行数据清洗、数据标注以及数据增强处理.其次,基于BERT-BiLSTM-CRF模型构建MacBERT-BiLSTM-CRF模型进行实体抽取任务.然后,定义继电保护装置缺陷文本的关系抽取规则,结合实体抽取模型共同完成关系抽取任务.最后,构建继电保护装置缺陷知识图谱的模式层,并利用Neo4j图数据库实现知识图谱数据层的存储.算例分析表明,所提数据处理方法能够得到高质量BIO标注数据集.相比于传统BERT-BiLSTM-CRF模型,MacBERT-BiLSTM-CRF模型的实体抽取效果更好.基于模式层完成了继电保护装置缺陷知识图谱的构建与可视化展示,并提出继电保护装置缺陷辅助决策的应用流程与知识图谱的更新方法.
ISSN:1674-3415
DOI:10.19783/j.cnki.pspc.240008