石忠亮,软件工程学院专职教师,硕士毕业于世界百强名校马来亚大学数据科学专业,获一等荣誉学位。
目前以一作者身份发表SCI一区和二区论文各一篇,擅长机器学习、自然语言处理等领域。
《Mathematics》期刊介绍
《Mathematics》(ISSN 2227-7390)是MDPI杂志社的一本数学领域期刊,创刊于2013年,发表数学领域的相关研究,于2019年被SCI收录。SCI是当代世界最为重要的大型数据库,被列在国际六大著名检索系统之首。它不仅是重要的检索工具书,也是科学研究成果评价的一项重要依据。SCI如今已经成为目前国际上最具权威性的、用于基础研究和应用基础研究成果的重要评价体系。
论文摘要
推特等社交媒体平台是检测重大事件(如自然灾害)的关键信息源。目前,在自动检测文本通信领域,研究主要集中在机器学习和深度学习算法上。最近的证据表明,在灾难检测的研究中,相较于传统的无语境技术,基于语境的词嵌入技术(即Transformer)能显著改善模型;
然而,关于这种模型的研究甚少。为此,本文通过合并Transformer和深度神经网络算法,研究了一系列集成学习模型,评估了它们在检测与灾害相关的推特的模型性能。本文共使用了7613条推特来训练和测试这些模型,实验结果表明集合模型拥有良好的性能,其F-score值达到了76%~80%;
同时相较于高计算成本的BERT模型, 简单的Transformers变体,如ELECTRA和Talking-Heads Attention,产生了类似甚至更优越的结果,特别是深度学习模型与Bi-LSTM合并时,F-score值达到80%~84%。我们的研究结果表明,较新和较简单的Transformers可以有效地检测与灾害相关的Twitter通信,且计算成本较低。