学生姓名: 胡致远
所属学校: 南京师范大学附属中学
地区: 江苏 南京市
研究实践

基于NLP的汉语口语语法错误检查与修正
----第三十届江苏省青少年科技创新大赛 中学科技创新成果项目
项目编号 学科分类 竞赛组别 项目类型 代表队 关键词
CS193001 计算机科学与信息技术 高中组 个人项目 江苏 语法错误检查与修正 BP神经网 自然语言处理(NLP)
项目简介:

为推动汉语在全世界的推广,填补汉语语音输入处理的末端问题解决方案的空白,针对汉语语音输入导致的口语化文字的语法错误只存在上下文依赖的词错误的特点,以及汉语无明确分词界限及句法规则复杂多变的难点,采用大数据和人工智能技术,提出基于自然语言处理(NLP)技术对汉语口语化语法错误检查修正的方法,建立3层BP神经网语法结构深度学习模型,通过网络爬虫自动获取互联网语料,借助分词工具、自定义停用词字典和自定义词库进行语料清洗,修正词语错误,然后通过自定义编码表转换为格式化的训练数据,自动收集并数字化语法结构,让计算机自动探索句法规则,最终借助Python3在基于Anaconda和Pycharm的平台上完成开发,实现了该模型的训练、调整和预测,实例运行表明该方法能实现语法错误检查和修正的功能,精度可达83.75%。