历史虚无主义内容审核
识别出互联网文本重的历史虚无主义内容
业务场景:
用户或者网文创作者为了博取眼球和流量,会歪曲解读历史及党史的人物和事件,不利于网民树立正确的党史观、历史观。需算法利用积淀语料,对历史虚无主义内容进行高亮提示、风险打分,对违规文本进行有效查杀。
技术描述:
基于BERT中文预训练模型,添加sequence分类层,在新闻文本数据集上做fine-tune后训练出历史虚无主义分类模型。