中文
Profile
VIEW MORE
>>欢迎咨询报考2026年硕士/博士研究生<<        张新生(1978~),男,博士,教授(博导),管理学院副院长。2009年12月毕业于西安电子科技大学,获得博士学位。2010年10月晋升为副教授,佛罗里达大学访问学者(2013-2014),2016年12月晋升为教授,现在西安建筑科技大学管理学院从事教学和科研工作。近年来主持国家自然科学基金1项、国家社科基金后期资助项目1项,教育部人文社科规划项目1项,陕西省重点产业链项目1项,陕西省自然科学基金3项、陕西省社科基金2项、陕西省教育厅自然科学基金3项等,主持横向项目6项,并参与了多项课题的研究工作。主要研究方向包括:智能社会治理;管理智能决策与优化;能资环(能源、资源、环境)智能管理与优化...
zhangxinsheng
Professor
Paper Publications
融合动态掩码注意力与多教师多特征知识蒸馏的文本分类
Release time:2025-09-07 Hits:
Journal:
中文信息学报
Key Words:
动态掩码注意力;;多教师多特征;;知识蒸馏;;文本分类
Abstract:
知识蒸馏技术可以将大规模模型中的知识压缩到轻量化的模型中,在文本分类任务中实现更高效的推断。现有的知识蒸馏方法较少同时考虑多种教师与多个特征层之间的信息融合。此外,蒸馏过程采用全局填充,未能动态关注数据中的有效信息。为此,该文提出一种融合动态掩码注意力机制与多教师多特征知识蒸馏的文本分类模型,不仅引入多种教师模型(RoBERTa、Electra)的知识源,还兼顾不同教师模型在多个特征层的语义信息,并通过设置动态掩码模型注意力机制使得蒸馏过程动态关注不等长数据,减少无用填充信息的干扰。在4种公开数据集上的实验结果表明,经过蒸馏后的学生模型(TinyBRET)在预测性能上均优于其他基准蒸馏策略,并在采用教师模型1/10的参数量、约1/2的平均运行时间的条件下,取得与两种教师模型相当的分类结果,平均准确率仅下降4.18%和3.33%,平均F<sub>1</sub>值仅下降2.30%和2.38%。其注意力热度图也表明动态掩码注意力机制切实加强关注了数据尾部与上下文信息。
Volume:
38
Issue:
03
Page Number:
113-129
ISSN No.:
1003-0077
Translation or Not:
no
Date of Publication:
2024-03-15

Pre One:AIGC背景下虚假信息治理挑战、机会与策略研究

Next One:基于CLIP文本特征增强的剪纸图像分类