面向不平衡数据集的浓香型白酒基酒等级分类研究
TS261.1; 为解决基于气相色谱-质谱联用(GC-MS)仪采集的浓香型白酒基酒等级分类中样本不均衡导致分类模型性能下降的问题,提出了一种面向不平衡数据集的浓香型白酒基酒分类研究.该方法首先采用合成少数类过采样技术(SMOTE)对浓香型基酒样品中少数类样本进行扩充,改善样本的不均衡性;然后结合稀疏主成分分析(SPCA)对GC-MS图谱数据进行降维;最后使用深度森林(DF)分类器建立浓香型白酒基酒分类识别模型.结果表明,使用SMOTE算法对基酒数据集进行平衡之后能够有效提高模型分类准确率,所建立的浓香型基酒分类模型正确率达到96.61%,该分类模型的建立对基酒等级分类能起到一定的指导和借鉴作用...
Saved in:
Published in | 中国酿造 Vol. 43; no. 1; pp. 184 - 189 |
---|---|
Main Authors | , , , , |
Format | Journal Article |
Language | Chinese |
Published |
四川轻化工大学 人工智能四川省重点实验室,四川宜宾 644000
25.01.2024
四川轻化工大学 自动化与信息工程学院,四川 宜宾 644000 |
Subjects | |
Online Access | Get full text |
ISSN | 0254-5071 |
DOI | 10.11882/j.issn.0254-5071.2024.01.029 |
Cover
Summary: | TS261.1; 为解决基于气相色谱-质谱联用(GC-MS)仪采集的浓香型白酒基酒等级分类中样本不均衡导致分类模型性能下降的问题,提出了一种面向不平衡数据集的浓香型白酒基酒分类研究.该方法首先采用合成少数类过采样技术(SMOTE)对浓香型基酒样品中少数类样本进行扩充,改善样本的不均衡性;然后结合稀疏主成分分析(SPCA)对GC-MS图谱数据进行降维;最后使用深度森林(DF)分类器建立浓香型白酒基酒分类识别模型.结果表明,使用SMOTE算法对基酒数据集进行平衡之后能够有效提高模型分类准确率,所建立的浓香型基酒分类模型正确率达到96.61%,该分类模型的建立对基酒等级分类能起到一定的指导和借鉴作用. |
---|---|
ISSN: | 0254-5071 |
DOI: | 10.11882/j.issn.0254-5071.2024.01.029 |