研究实践
基于集成学习和微调大语言模型的假新闻检测双路径研究
----第三十六届江苏省青少年科技创新大赛
| 项目编号 | 学科分类 | 竞赛组别 | 项目类型 | 代表队 | 关键词 |
| CS253035 | 计算机科学与信息技术 | 高中组 | 个人项目 | 江苏 | 上下文学习 集成学习 大语言模型 机器学习 假新闻检测 |
项目简介:
在社交媒体主导信息传播的背景下,假新闻的泛滥对社会信任与公共安全构成严峻挑战。传统检测方法因难以应对复杂多变的虚假信息模式而显不足,而大语言模型的兴起为深度挖掘文本特征提供了新思路。本研究基于跨学科视角,融合自然语言处理、社会科学与集成学习,提出FIND框架,通过结合微调LLM、上下文学习与多模型集成技术,构建高效假新闻检测系统。具体而言,研究采用BERT等模型进行语义微调,集成随机森林、逻辑回归与LLM模型,并设计动态提示工程结合搜索引擎实时验证信息,有效抑制模型幻觉。基于17,000条Twitter新闻数据集的实验表明,FIND框架准确率达86.36%,显著优于单一模型。创新点体现于:1)首创多模态集成架构,融合LLM与传统机器学习优势;2)动态上下文增强机制,通过实时外部知识优化检测泛化性;3)抗幻觉设计,引入搜索-提示-决策工作流提升事实核查可靠性;4)跨学科方法整合语言特征