热点事件新闻语料库的研制及词汇研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:zhaojianan1987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国内对新闻语言的研究取得一定成果,新闻语言研究的论著相继发表、出版,但研究的出发点通常是写作和修辞,讨论语言如何去适应新闻写作的要求,如何增强新闻语言的表达效果,而基于社会热点事件语料库的新闻语言研究则很少。本研究从语言学的角度、运用语言学理论研究新闻语言。首先,对现代汉语语域信息库进行回溯。已建成的日常、法律、商务、体育语域信息库为语言分语域研究提供了第一手资料,基于语料库的分语域语言研究取得了一定成果,本研究为信息库中的新闻语域部分。其次,建立“社会热点事件新闻语料库”。本研究收录《扬子晚报》2009年全年社会热点事件,根据筛选标准,最终筛选出48.9万字的热点事件。其中70%是PDF形式,需要利用OCR软件将其转换成word形式,转换过程中进行校对,以保证语料的正确性。为方便以后的查找、校对,对语料库中的语料还要进行分类及编码。本新闻语域语料库包含33件热点事件,库中共365个文件,每条新闻都有一个编码,并附有新闻标题,报道的时间、记者、版面及字数统计。在确定语料属性及语料库研制原则的前提下,按照语料库的研制步骤,对语料库进行深度加工。本研究采取机器自动分词及词性标注方式,再辅以人工校对。对分词及词性标注过程中出现的问题再进行讨论,使其适合新闻语域的语言特点,为基于语料库的新闻语言研究打下基础,最终建成赋码语料库。最后利用“社会热点事件新闻语料库”。对语料库中的词汇进行词频统计制成《热点事件新闻词汇频度表》,并编制《热点事件新闻基本词汇表》。将热点事件新闻词表(选取高频词、次高频词及部分中频词)与通用词表比较,经过筛选得到特殊词汇216个,参考语义及语料分布对特殊词汇进行分类。全部词汇都要回归到语料库中进行检索,根据热点事件发生特点分为“表示时间”、“事件描述”、“网络推动”、“媒体介入”、“司法介入”、“事件影响”六大类。特殊词汇的分类并不是主观断定,而是基于语料库,该词语在语料库中的分布决定其所属类别,在分类基础上进而梳理热点事件的引发—持续模式。本研究坚持定量研究和定性研究相结合的方法,建成的“社会热点事件新闻语料库”,及提取的《热点事件新闻基本词汇表》,为新闻教学、新闻辞典的编撰及新闻语言学的发展提供参考。梳理的热点事件报道模式对新闻采编及报道有一定的启示意义。
其他文献
端粒在细胞正常生理功能运转过程中起重要作用,涉及到染色体末端复制、端粒酶作用机制、肿瘤及衰老等多方面问题,端粒的缺失将造成多种病理状况,直接影响到细胞的生存,随着人们对
Annexins蛋白是一类具有典型生物学特征的大分子,参与一系列与Ca2+相关的生物学活动.AnnexinⅡ作为该家族的成员,同样参与了多种生物学活动,现在已经受到越来越多的关注.本文
目前,我国猪价呈持续攀升走势。据农业部监测,全国480个集贸市场活猪价格已连续上涨20周。全国4000个生猪养殖村生猪存栏已连续9个月环比下降,处于2008年以来的最低水平。当前,我
眼皮肤白化病Ⅲ型(OCA3)由酪氨酸酶相关蛋白1基因(TYRPl)突变所致,该基因与酪氨酸酶基因(TYR)结构相似.有研究显示,TYRPl在黑色素的合成过程中发挥重要作用,但具体机制尚未完全明了.较早前已确定了TYRPl基因S166X和1104delA两种病理性突变,最近在巴基斯坦和德国先后发现3种TYRPl基因新突变R373X、R356E、L36X,但它们与OCA3的关系有待进一步确定.以前曾认
目的:探讨中国急性髓系白血病(AML)患者中C-Kit、NPM1、FLT3基因突变和MLL部分串联重复(MLL-PTD)的发生率和分布情况,并分析其与预后的相关性。方法:应用基因测序的方法分别检测656
为了促进戴云山羊养殖产业的发展,本文开展了放牧戴云山羊生长性状、繁殖性状等的测定,分析了当前戴云山羊养殖成本、生产效率、经济效益并提出发展对策。结果表明:周岁戴云