基于CNN和LSTM的多通道注意力机制文本分类模型
TP391; 针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-TermMemory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型.使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上.在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更...
Saved in:
| Published in | 计算机工程与应用 Vol. 57; no. 23; pp. 154 - 162 |
|---|---|
| Main Authors | , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
西安邮电大学,西安 710121
01.12.2024
陕西省网络数据分析与智能处理重点实验室,西安 710121%桂林电子科技大学,广西 桂林 541004 广西可信软件重点实验室,广西 桂林 541004 |
| Subjects | |
| Online Access | Get full text |
| ISSN | 1002-8331 |
| DOI | 10.3778/j.issn.1002-8331.2104-0212 |
Cover
| Summary: | TP391; 针对传统的卷积神经网络(Convolutional Neural Network,CNN)和长短时记忆网络(Long Short-TermMemory,LSTM)在提取特征时无法体现每个词语在文本中重要程度的问题,提出一种基于CNN和LSTM的多通道注意力机制文本分类模型.使用CNN和LSTM提取文本局部信息和上下文特征;用多通道注意力机制(Attention)提取CNN和LSTM输出信息的注意力分值;将多通道注意力机制的输出信息进行融合,实现了有效提取文本特征的基础上将注意力集中在重要的词语上.在三个公开数据集上的实验结果表明,提出的模型相较于CNN、LSTM及其改进模型效果更好,可以有效提高文本分类的效果. |
|---|---|
| ISSN: | 1002-8331 |
| DOI: | 10.3778/j.issn.1002-8331.2104-0212 |