汉语水平考试(HSK)阅读文本可读性自动评估研究

来源 :语言文字应用 | 被引量 : 0次 | 上传用户:LittleMeteor
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文基于汉语二语文本可读性的特征集合,通过对比六种机器学习模型的效果,引入特征选择算法,实现了汉语水平考试(HSK)阅读文本可读性的自动评估。实验结果表明,支持向量机模型在HSK阅读文本可读性评估中的表现最好;基于汉字、词汇、句法和篇章的全特征模型的预测准确率达0.876;不同层面的特征预测能力存在差异,其中词汇层面表现最好;剔除冗余特征后,词汇和汉字两个层面的18个特征进入最优模型,句法和篇章特征未能进入该模型。本研究对HSK阅读文本的选择和改编及其他类型的文本可读性评估具有一定的参考意义。
其他文献
王充,两汉相交之际的著名学者,其著作《论衡》是中国中古时期论证研究的重镇,对当今的论证研究有着重要参考价值。对于《论衡》的研究,以往多关注内容而较少涉及论证。然而,从《论衡》的论证规则和论证策略出发回答其有效性的来源,从而推进对《论衡》思想的确认和理解,构成了《论衡》乃至王充思想研究的核心问题。为此,对《论衡》的研究需要引入广义论证理论下的“以中释中”程序,聚焦两汉社会背景,从语境理解规则、功能规
由于互联网行业发展的成熟、互联网金融衍生品的竞相推出以及人们消费观念的转变,银行业的存款业务受到了重大冲击。通过对银行定期存款预测问题的研究,可以帮助银行应对存款业务危机。本文主要是对银行定期存款预测中的关键技术进行研究,提出基于改进的鸡群优化算法的特征选择方法,并构建基于Stacking方法的银行定期存款预测集成模型。主要工作包括:1)针对特征选择问题,提出一种基于改进的鸡群优化(ICSO)算法
笔者以危险废物为主线,分析了目前我国危险废物产生现状及主要处置技术,简述了危险废物处理处置产业和市场发展现状、发展历程等,阐述了危险废物处理处置产业目前存在问题,并结合实际工作中遇到的难题及公司自有特色,就危险废物处理处置产业发展提出相关建议。
近年来互联网金融的兴起对传统银行产生了巨大的冲击,传统银行的优势在于拥有巨大的客户数据库,为了提高传统银行的竞争力,可以借助机器学习的方法对大量客户进行区分,从而寻找出潜在客户,实行高效管理。由于银行数据量大、特征多的特点,该文通过决策树算法对其进行分类和预测,首先观察统计数据特征对数据进行清洗预处理,再利用不平衡算法解决数据量不平衡问题,最后利用决策树算法建立最终模型,对客户进行分类和预测,向潜
在幼儿教育中培养幼儿的语言表达能力,可提高幼儿的交流能力,促进幼儿的智力发育。但是,受教师关注度低与教学方法固化等因素影响,幼儿语言表达能力的培养效果不尽理想,还需加强实践经验总结。本文笔者针对幼儿语言表达能力的培养,提出了"通过了解幼儿身心,实现精准设计""通过生活化情景,促进幼儿的表达""通过词汇量积累,提高表达的自信""通过引导与交流,强化幼儿的心理""通过表达与示范,促进幼儿的模仿"等五个
<正>篮球运动是重要的体育项目,作为学校体育教学的重要内容之一,不可避免地承担着立德树人的重要使命。深入挖掘篮球运动中蕴含的德育价值,借助篮球运动开展德育活动,不仅是体育课程中思想政治教育改革的需要,也是当前教育形势发展的需要。众所周知,德育活动的开展是一个潜移默化的过程,正因为如此,更应该将德育活动贯穿到教育的各个环节中。体育是教育过程中非常重要的一环,而篮球运动又是体育教育的重要途径,因此,深
期刊
<正>儿子从小就是内向的孩子,喜欢看书,喜爱思考,这是好事。遗憾的是,在人多的场合,我很难见到他的身影。尤其是在别的孩子们争先恐后地表现才能的时候,他一定是躲在角落里。究其原因,我觉得是他不太自信。我总是不断鼓励他前进,让他和更多的伙伴学习交流,寻找更多的快乐。但我这样做收效甚微,过不了几天,儿子就会恢复老样子。有一天,儿子放学后兴冲冲地告诉我,老师表扬他了,说他唱歌唱得棒极了,作文也写得好,还被
期刊
贷款信用风险评估是银行风控的重要内容。贷款逾期天数作为常见的风险度量指标,具有典型的零膨胀特征。对于零膨胀数据,传统的线性回归不再适用,两部模型是常用的代表方法。考虑到贷款数据具有偏态分布特征,本文构建了一个分位数两部模型—logit-quantile模型。该模型由Logistic回归和分位数回归构成,为了进行风险因素的选择,在模型的两个回归中添加了Lasso惩罚。为了求解模型,本文采用了坐标下降
为落实智慧民航发展主线,驱动行业高质量发展,充分发挥民航行业数据价值,大数据技术不断地被综合运用于“智慧机场”的建设中。文章通过对某大型机场大数据技术应用现状情况分析,结合新一代信息技术发展趋势和机场大数据应用服务需求,给出了一种基于混合云弹性伸缩架构的机场大数据平台设计方案,为机场数字化转型大数据应用提供借鉴。