面向不平衡数据集的浓香型白酒基酒等级分类研究

TS261.1; 为解决基于气相色谱-质谱联用(GC-MS)仪采集的浓香型白酒基酒等级分类中样本不均衡导致分类模型性能下降的问题,提出了一种面向不平衡数据集的浓香型白酒基酒分类研究.该方法首先采用合成少数类过采样技术(SMOTE)对浓香型基酒样品中少数类样本进行扩充,改善样本的不均衡性;然后结合稀疏主成分分析(SPCA)对GC-MS图谱数据进行降维;最后使用深度森林(DF)分类器建立浓香型白酒基酒分类识别模型.结果表明,使用SMOTE算法对基酒数据集进行平衡之后能够有效提高模型分类准确率,所建立的浓香型基酒分类模型正确率达到96.61%,该分类模型的建立对基酒等级分类能起到一定的指导和借鉴作用...

Full description

Saved in:
Bibliographic Details
Published in中国酿造 Vol. 43; no. 1; pp. 184 - 189
Main Authors 王继华, 李兆飞, 杨壮, 赵娜, 张贵宇
Format Journal Article
LanguageChinese
Published 四川轻化工大学 人工智能四川省重点实验室,四川宜宾 644000 25.01.2024
四川轻化工大学 自动化与信息工程学院,四川 宜宾 644000
Subjects
Online AccessGet full text
ISSN0254-5071
DOI10.11882/j.issn.0254-5071.2024.01.029

Cover

More Information
Summary:TS261.1; 为解决基于气相色谱-质谱联用(GC-MS)仪采集的浓香型白酒基酒等级分类中样本不均衡导致分类模型性能下降的问题,提出了一种面向不平衡数据集的浓香型白酒基酒分类研究.该方法首先采用合成少数类过采样技术(SMOTE)对浓香型基酒样品中少数类样本进行扩充,改善样本的不均衡性;然后结合稀疏主成分分析(SPCA)对GC-MS图谱数据进行降维;最后使用深度森林(DF)分类器建立浓香型白酒基酒分类识别模型.结果表明,使用SMOTE算法对基酒数据集进行平衡之后能够有效提高模型分类准确率,所建立的浓香型基酒分类模型正确率达到96.61%,该分类模型的建立对基酒等级分类能起到一定的指导和借鉴作用.
ISSN:0254-5071
DOI:10.11882/j.issn.0254-5071.2024.01.029