【摘 要】
:
近年来,新闻文本自动化生成的应用越发普遍,其出现既带来了新的新闻创作模式,也影响了新闻读者的阅读体验。尽管机器生成新闻的影响已经得到学界的关注,目前仍缺少从语言学角
论文部分内容阅读
近年来,新闻文本自动化生成的应用越发普遍,其出现既带来了新的新闻创作模式,也影响了新闻读者的阅读体验。尽管机器生成新闻的影响已经得到学界的关注,目前仍缺少从语言学角度分析自动化新闻文本特征的研究。为了填补这一空缺,本研究以基于语料库的多维分析法探究机器生成新闻文本的语域变异。通过将自建的机器生成新闻语料库和传统新闻语料库置于Biber(1988)的多维模型下进行语域对比,本研究发现机器生成的新闻文本有以下语域变异特征:与传统新闻相比,机器生成新闻文本的信息性表达更强,叙述性关切更弱,情景依赖性更强,显性劝说型表述更弱,以及信息抽象程度更强。其次,当机器生成新闻与传统新闻被放在财经、体育、政治三个不同的新闻类型下进行多维对比时,本研究发现机器生成新闻与传统新闻的语域差异程度在不同新闻类型之间表现出不规则性。最后,在词汇语法特征上,本研究发现了6个在机器生成新闻文本中使用频次显著较高或较低的语言特征,它们分别为句子关系分句、普通名词、普通副词、主动词BE、分裂助动词、和现在分词分句。本研究将机器生成新闻作为有别于传统新闻的子语域进行了分析,从语言学角度全面地描述了机器生成新闻文本的语域特征;本研究所发现的机器生成新闻与传统新闻之间的语域特征差异可帮助算法开发者在语言风格输出方面更好地完善新闻生成算法。
其他文献
近年来数据呈现指数级增长,数据爆炸的年代显然已经到来。面对与日俱增的数据需要我们高效快速的摄取重要数据、剔除冗余数据。其中有一部分数据具有不确定性,而粗糙集及软集
钢管混凝土结构由于具有承载力高、延性性能好、易于施工、耐火耐腐蚀、经济效益好等优点,在大跨桥梁、工厂和高层建筑等实际工程中均有较为广泛的应用。碳纤维增强复合材料(
群推荐系统已经成为社交网络平台的重要工具,该系统面向群体用户提供兼顾个性化和整体满意度的产品和服务。现有的群推荐方法大多是对个性化推荐方法的集成和聚合,但都忽略了
目前,智能手机等移动设备已经成为我们日常生活中使用最广泛的拍照设备。在使用移动设备进行拍照的时候,经常会遇到一些高动态范围的场景。在这种场景下拍摄所得到的图像往往
随着测序技术的不断发展,DNA测序技术在疾病预测和基因诊断方面的研究及应用变得越来越普遍。针对目前癌症病变高发的情况,引入DNA测序技术来帮助研究人员识别癌症标志物,对
随着全球经济一体化进程的加速,国内企业面临着复杂的外部环境。企业需要与不同的组织合作,互相传递消息,共享资源,共同应对环境的不确定性。董事会作为企业战略决策的主体,在战略性投资决策上发挥着巨大的作用。企业重大的投资决策需要很多的信息和资源,而企业可以通过连锁董事网络获取一定的外部信息和资源,为企业的战略性投资决策提供支持。在新形势下,如何有效利用连锁董事网络,进而提升企业的战略性资产,是企业面临的
锂电池作为新型能源电池因其优异的性能在电动自行车中得到了广泛的应用,其已经逐渐取代传统的铅酸电池成为电动自行车的动力源。然而,锂电池在工作过程中可能会遇到如下问题
混凝土材料依靠其优越的工程和力学性能,广泛的应用于建筑工程各领域。在各种类型的建筑结构中,混凝土结构占据着主导地位。但是,由于混凝土材料本身特性以及各种复杂环境等
在布雷顿森林体系下,现行国际金融组织的决策机制多为金融大国所控制。亚洲基础设施投资银行(以下简称亚投行)是首个由中国倡导建立,致力于促进发展中国家基础设施建设和经济互联互通的区域性金融组织。亚投行的决策机制能否体现广大发展中国家的利益是区别于同类国际金融组织的关键。本文通过对比同类国际金融组织在决策机制中的设计及其在实践运行中的缺陷,探究亚投行决策机制的合理性并提出完善意见。国际金融组织的决策机制
积雪是地球外部圈层水圈的地理要素之一,也是研究地球表层循环系统的重要要素之一。青藏高原作为世界第三极因其特殊的地理条件使其成为中国大陆主要积雪区之一,就全球尺度而