获取关键词的方法及装置

本发明公开了种获取关键词的方法及装置。该方法包括:对文本信息进行分词处理,得到多个分词;构建所述多个分词的词共现图,其中,每个分词作为所述词共现图的个顶点,并且两个顶点之间的边线的权重为所述两个顶点所对应的分词在所述文本信息中的共现次数;根据所述词共现图,确定每个分词的网络最短距离变化参数、网络聚集系数变化参数以及中间性参数中的至少者;根据所确定出的所述每个分词的网络最短距离变化参数、网络聚集系数变化参数、中间性参数中的至少者、以及预设的各参数的权重系数,分别确定所述每个分词的重要性;以及按照重要性从高到低的顺序,获取预定数量的分词作为关键词。由此,能够从文本信息中准确提取出关键词。 The...

Full description

Saved in:
Bibliographic Details
Format Patent
LanguageChinese
Published 14.09.2018
Subjects
Online AccessGet full text

Cover

More Information
Summary:本发明公开了种获取关键词的方法及装置。该方法包括:对文本信息进行分词处理,得到多个分词;构建所述多个分词的词共现图,其中,每个分词作为所述词共现图的个顶点,并且两个顶点之间的边线的权重为所述两个顶点所对应的分词在所述文本信息中的共现次数;根据所述词共现图,确定每个分词的网络最短距离变化参数、网络聚集系数变化参数以及中间性参数中的至少者;根据所确定出的所述每个分词的网络最短距离变化参数、网络聚集系数变化参数、中间性参数中的至少者、以及预设的各参数的权重系数,分别确定所述每个分词的重要性;以及按照重要性从高到低的顺序,获取预定数量的分词作为关键词。由此,能够从文本信息中准确提取出关键词。 The invention discloses a keyword obtaining method and apparatus. The method comprises: performing word segmentation processing on text information to obtain a plurality of segmented words; constructing a word co-occurrence map of the segmented words, wherein each segmented word is a vertex of the word co-occurrence map, and a weight of a sideline between two vertexes is a co-occurrence frequency of the segmented words corresponding to the two vertexes in the text information; according to the word co-occurrence map, determining at least one of a network shortest distance change parameter, a network clustering coefficient change parameter and an intermediate parameter of each segmented word; according to the determined
Bibliography:Application Number: CN20151666887