[目的/意义] 大规模预训练模型的发展开启了人工智能领域的新阶段,越来越多的研究者将BERT、GPT等模型引入到各应用领域,但其复杂性和可解释性的问题给模型通用化带来一定程度的风险,与此同时,分类任务中训练数据的人工标注成本高,其质量直接影响模型的可用性,自动优化数据标注质量往往可以节约资源,提高模型的训练效率和模型的可用性。[方法/过程] 提出GSBERT(Gradient Saliency BERT Model)模型,该模型基于梯度显著度的方法探寻BERT模型决断依据,并通过可视化方式呈现BERT模型决断过程,使模型决策具有可解释性;在通过梯度显著度计算样本特征词的基础上,提取样本特征分布作为GSBERT检测标注的依据。为了检验GSBERT在分析数据一致性上的效果,利用GSBERT模型对新闻分类数据集的“误分类”样本进行重新标注,由于标注质量的提高,使模型在验证集上准确率提升12.55%。[结果/结论] 从大模型可解释性的角度出发,探究一种全新有效的挖掘数据价值的方法,为各领域更广泛地应用深度学习技术提供借鉴思路。