本文作者:张振昌;成功正常投稿发表论文到《厦门大学学报(自然科学版)》2014年06期,引用请注明来源400期刊网!
【摘要】:基于统计的方法是当前机器翻译领域主流的研究方向之一,其中对齐模板统计翻译模型是效果较好的一个统计模型,而双语词聚类在对齐模板统计模型参数训练中占有十分重要的地位.本研究针对其参数训练的双语词聚类,在原有的非层次聚类基础上,提出了双语层次聚类的算法;另外,又结合2种算法的思想,提出一种新的混合算法.使用信息熵作为评价标准,结果显示混合算法的聚类效果有3.4%~5.0%的改进.
【论文正文预览】:1预备知识1.1统计机器翻译概述20世纪90年代初,PeterBrown等[1]提出了基于信源信道思想的统计机器翻译模型,在实验上取得初步的成功.不过由于当时计算能力不足等多方面原因,对统计机器翻译方法进行深入研究的人并不多.直到1999年,约翰霍金斯(JHU)大学的统计机器翻译夏季讨论
【文章分类号】:TP391.2
【稿件关键词】:双语词聚类对齐模板信息熵
【参考文献】:
- 刘群;统计机器翻译综述[J];中文信息学报;2003年04期
- 张贯虹;高玲玲;;一种基于统计和模板的双层翻译研究[J];电脑知识与技术;2008年32期
- 肖明;;机器翻译系统中间件模型[J];福建电脑;2006年03期
- 卢朝华;徐好芹;王玉芬;;基于语义分析的汉语介词短语识别方法研究[J];电脑与电信;2012年03期
- 王斯日古楞;斯琴图;那顺乌日图;;基于短语的汉蒙统计机器翻译研究[J];计算机工程与应用;2010年14期
- 徐金安;;理性主义与经验主义相结合的机器翻译研究策略[J];计算机科学;2011年06期
- 周新栋,王挺;基于N元语言模型的文本分类方法[J];计算机应用;2005年01期
- 骆凯;李淼;强静;乌达巴拉;;基于统计和模板的双层汉蒙翻译研究[J];计算机应用;2009年07期
- 王晓涓;赵春;;最大熵方法在英语名词短语识别中的应用研究[J];计算机仿真;2011年03期
- 李俊;薛永增;赵铁军;;常用统计翻译模型在口语汉英翻译中的比较研究[J];计算机应用研究;2007年06期
- 胡乃全;孔芳;王海东;周国栋;朱巧明;;基于最大熵模型的中文指代消解系统实现[J];计算机应用研究;2009年08期
- 吴秋锋;黄书剑;戴新宇;陈家骏;;一种基于句法的用于汉英翻译的预调序方法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
- 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
- 张大鲲;张玮;董静;;基于非连续短语的统计翻译模型[A];第三届学生计算语言学研讨会论文集[C];2006年
- 强静;李淼;高翊;胡冠龙;胡泽林;;多民族语言农业知识处理平台[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
- 李响;徐金安;刘群;吕雅娟;姜文斌;;移动终端机器翻译设备的解码定点化方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
- 杨雨图;支持双语的协同CAPP系统若干关键技术研究[D];南京航空航天大学;2006年
- 郭永辉;英汉机器翻译系统关键技术研究[D];解放军信息工程大学;2006年
- 方淼;语义单元自动获取研究[D];大连理工大学;2008年
- 薛永增;统计机器翻译若干关键技术研究[D];哈尔滨工业大学;2007年
- 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
- 巢文涵;基于双语语料库的机器翻译关键技术研究[D];国防科学技术大学;2008年
- 雪艳;汉蒙词语对齐及相关技术研究[D];内蒙古大学;2009年
- 王斯日古楞;基于混合策略的汉蒙机器翻译及相关技术研究[D];内蒙古大学;2009年
- 百顺;日蒙机器翻译及相关技术研究[D];内蒙古大学;2012年
- 马建军;面向机器翻译的英语功能名词短语识别研究[D];大连理工大学;2012年
- 张庐颖;基于粗糙集的K-means研究[D];北京交通大学;2011年
- 李志青;基于Internet的互动辅助翻译技术研究[D];内蒙古大学;2011年
- 银花;基于短语的蒙汉统计机器翻译研究[D];内蒙古师范大学;2011年
- 王茜;[D];电子科技大学;2011年
- 卢朝华;基于语义分析的汉语短语识别方法研究[D];河南科技大学;2009年
- 刘莎莎;大规模中文机构名称与机构地址自动翻译研究[D];哈尔滨工业大学;2010年
- 许冲;统计机器翻译中层次短语翻译模型的研究与实现[D];哈尔滨工业大学;2010年
- 霍亚格;汉语短语识别方法研究[D];河南科技大学;2011年
- 占飞;计算语言学领域英文辅助写作系统[D];哈尔滨工业大学;2011年
- 康维鹏;基于复述的问题扩展技术研究[D];哈尔滨工业大学;2011年
【稿件标题】:k means聚类算法|基于信息熵的双语词聚类算法
【作者单位】:福建农林大学计算机与信息学院;
【发表期刊期数】:《厦门大学学报(自然科学版)》2014年06期
【期刊简介】:0......更多厦门大学学报(自然科学版)杂志社(
http://www.400qikan.com/qk/10470/)投稿信息
【版权所有人】:张振昌;
更多
自然类论文详细信息:
k means聚类算法|基于信息熵的双语词聚类算法 论文代写
http://m.400qikan.com/lw-24044 论文代发
相关专题:青海师大学报 论文发表最好的网站