矿山行业大模型建设路径探索与应用展望
TP18; 煤炭是保障能源安全的压舱石.在当前加快发展数字经济、积极稳妥推进"双碳"目标的背景下,煤炭行业亟需深化数字化转型与智能化建设.在此背景下,探索引入大模型技术赋能煤炭行业应用,充分利用行业海量知识数据,加快推动煤炭行业的数字化发展,已成为行业关注的焦点.基于此,梳理了通用大模型技术的发展现状,阐述了大模型技术在多领域的应用现状与成效,介绍了数据处理(清洗、平衡、增强等)、文本分词、预训练与微调、提示词优化、向量嵌入、对齐、检索增强生成等行业大模型关键技术,表明了行业大模型在继承通用大模型"通"的优势的同时又兼具"专"的特点,...
Saved in:
Published in | 煤炭科学技术 Vol. 52; no. 11; pp. 45 - 59 |
---|---|
Main Author | |
Format | Journal Article |
Language | Chinese |
Published |
煤炭智能开采与岩层控制全国重点实验室,北京 100013
01.11.2024
煤炭科学研究总院有限公司矿山人工智能研究院,北京 100013 天地科技股份有限公司,北京 100013 |
Subjects | |
Online Access | Get full text |
ISSN | 0253-2336 |
DOI | 10.12438/cst.2024-1382 |
Cover
Summary: | TP18; 煤炭是保障能源安全的压舱石.在当前加快发展数字经济、积极稳妥推进"双碳"目标的背景下,煤炭行业亟需深化数字化转型与智能化建设.在此背景下,探索引入大模型技术赋能煤炭行业应用,充分利用行业海量知识数据,加快推动煤炭行业的数字化发展,已成为行业关注的焦点.基于此,梳理了通用大模型技术的发展现状,阐述了大模型技术在多领域的应用现状与成效,介绍了数据处理(清洗、平衡、增强等)、文本分词、预训练与微调、提示词优化、向量嵌入、对齐、检索增强生成等行业大模型关键技术,表明了行业大模型在继承通用大模型"通"的优势的同时又兼具"专"的特点,在推动行业生产力革新和产业升级方面发挥着重要作用.深度剖析了大模型技术在煤炭行业应用面临研发投入成本高、高质量数据搜集难度大、多模态数据融合技术难度高等挑战,从基础设施层、数据资源层、算法模型层、应用服务层、安全可信与测试层、行业生态层六方面详细总结了太阳石矿山大模型为应对上述挑战采取的建设路径以及取得的阶段性成效,最后对大模型技术的发展给煤炭行业带来的生产与技术变革进行了展望,指出矿山行业大模型建设应遵循开源模型与行业数据相结合的路径,发挥大模型的工具属性以赋能业务场景、构建"产-学-研-用"相结合的应用生态,助力矿山行业新质生产力的发展. |
---|---|
ISSN: | 0253-2336 |
DOI: | 10.12438/cst.2024-1382 |