【摘 要】
:
本文提出了一种利用双字耦合度和t-测试差解决中文分词中交叉歧义的方法:首先利用词典找出所有的交叉歧义,然后用双字耦合度和t-测试差的线性叠加值来判断各歧义位置是否该切分
【机 构】
:
中国科学院计算技术研究所,中国科学院研究生院
【基金项目】
:
国家973计划资助项目(2004CB318109);国家自然科学基金资助项目(60603094)
论文部分内容阅读
本文提出了一种利用双字耦合度和t-测试差解决中文分词中交叉歧义的方法:首先利用词典找出所有的交叉歧义,然后用双字耦合度和t-测试差的线性叠加值来判断各歧义位置是否该切分。实验结果表明,双字耦合度和t-测试差的结合要优于互信息和t-测试差的结合,因此,用双字耦舍度和t-测试差的线性叠加值来消除交叉歧义是一种简单有效的方法。
其他文献
<正> 适当的粘稠特性、流变特性,赋予了食品独特的组织结构和口感并在稳定各种食品的质量特性上起到一定的作用。因此,能提供这些特质的胶体,在食品体系中具有广泛的应用性。
文章以随机抽取的湖北省301名农村小学儿童为被试对象,采用日本学者铃木清编制的GAT量表进行测试.结果表明:农村小学儿童普遍存在一般性焦虑心理,年级之间存在极显著差异,并随年级
【正】政府浪费现象已成为我国目前最难根治的社会公害之一。如何将精细化管理渗透到政府管理的日常工作中,寻找管理的粗糙点,将管理水平提升到新的高度,是政府加强社会管理
建筑耗能是我国能源消耗的一个主要方面,发展建筑节能技术已成为我国建成低碳社会的关键。中国幅员辽阔,为更好地发展建筑节能技术,必须将建筑节能科学观与我国地域性问题结
使用近景摄影测量方法绘制了重庆市部分地区古文物,叙述了以李渡区蔺市龙门桥石象等值线图测量为例的作业过程,包括控制测量、摄影及摄影测量处理,特别是使用了普通测量前方交会
【正】 随着经济体制的改革,我国企业迫切需要改善经济管理,实现决策科学化。科学的决策方法有多种多样,本文打算利用影子价格进行经济决策,做到人尽其力,物尽其用,以求实现
为去除生产双酚A工业废水中的苯酚、丙酮、双酚A以及溶解于丙酮中很多难以监测的含酚类成分,通过厌氧颗粒污泥静态培养及驯化,验证其厌氧微生物对此类废水的适应性及处理效果
考试焦虑是考生最经常体验到的情绪状态之一,也是考生自身的一种保护性反应.对考试或测验产生的焦虑就称为考试焦虑.特别是对于参加升学考试的高中生和期终考试的大学新生来
《扔在八月的路上》是2006年度轰动日本文坛的第135届“芥川奖”的获奖作品。其作者为1971年出生、早稻田大学经济学系毕业的青年作家伊藤TAKAMI。伊藤出道十年。共发表了14
工程质量是建设项目的生命,是项目成败的关键,工程质量既体现了一个国家的形象,反映了一个民族的素质,也与经济社会发展息息相关,更关乎老百姓的生命财产安全。对当前园林工