当代汉字系统优化的基本原则
摘要:汉字系统优化包括自然优化和整理优化,这两种类型的优化都是汉字自身发展的必然要求。对当代汉字系统进行整理优化,必须坚持共时原则、通语原则和效度原则。只有当代实际应用的、记录普通话词汇或已被普通话吸收的方言词汇的汉字,才有资格成为通用汉字;而记录汉语的效度,则是衡量汉字系统是否优化的一个重要指标。现代汉字笔画系统的简化、排序及命名
摘要:笔画系统的面貌在最基础的层面上影响着汉字的面貌和难度。一个相对简明、区别度高、使用频率分布合理的笔画系统对汉字的规范、教学、传播、传承都非常重要。本文的数据和论证表明,在基本不引起重新认读的前提下,笔画系统至少可以由现在的32个简缩为24个。本文以能反映笔画内部规律的原则对24个笔画进行排序,并重新命名18个复合笔画。“微”词族的形成轨迹及语义演变
摘要:2009年"微博"登陆中国以来,"微××"格式迅速在网络上流行,形成了一个新词家族——"微"词族。本研究基于网络检索的183个"微"族词,寻绎"微"词族的形成轨迹和词素"微"的语义演变特点。基于语义偏离规则,词素"微"被赋予新的语义和色彩;基于"方式化……泛指化……抽象化"的语义—功能类别化,词素"微"演化为具有极大能产性的词缀;基于与复音词的组合,"微"族词趋于词音结构三音节化。在主体需求和语言机制的合力中,"微"族词迅速流行,"微"词族日益壮大。行业语在新词中使用的新特点
摘要:行业语在新词中的使用出现了一些新特点,包括赋予普通词新的行业语意义,行业语通过语义的泛化进入新词,语义泛化后的行业语在构形上的变化表现为增加语素、减少语素和替换语素,字母行业语大量进入新词,泛化后的行业语实现了语法功能的增值等等。这些新特点促进了行业语与新词的不断融合。但在融合过程中也出现了任意改动原行业语词形而错用、因不了解行业语原义而误用等在语言运用方面的不良倾向。历年高考病句试题的演变路径及理论分析
摘要:本文考察60年来高考语文病句试题的基本阶段、演变路径及其蕴涵的理论问题。根据考查内容、方式及分值分布的变化,高考语文病句试题的命题可以划分为四个发展阶段,最常考查的类型是与搭配不当、关联词语、成分残缺以及歧义相关的病句。高考病句命题受到语言生活、语言研究、汉语自身特点和语文教育等方面的影响,其中折射出语言观和语言规范观的变化和调整。以汉字教学促进汉语国际教学与推广
摘要:本文论述汉语水平为零起点的留学生在初级教学阶段开设汉字教学课程的必要性、可能性,同时还介绍汉字教学课程在汉字认字、查字、写字诸方面的具体做法,说明汉字教学对促进汉语国际教学与推广的重要作用。《汉字应用水平等级及测试大纲》修订项目通过专家鉴定
摘要:《汉字应用水平等级及测试大纲》(以下简称《大纲》)是由教育部语用所研制,教育部、国家语委于2006年公布的语言文字规范,自2007年实施以来,全国14个省(自治区、直辖市)先后开展了试点工作,约16万人参加了测试。试点取得了良好效果,并在社会上产生了一定影响。2013年8月19日,国务院《通用规范汉字表》。按照规定,该字表后,汉语复句关系词自动识别中规则的约束条件研究
摘要:关系词在汉语复句中具有重要的作用,是汉语语法、语义的重要研究内容,在信息处理领域具有很高的研究价值,但复句关系词的计算机自动识别是一个非常困难的问题。本文从中文信息处理角度,研究"基于规则的关系词自动识别"系统中规则的约束条件,为进一步研究计算机自动识别复句的方法以及自动识别汉语句子和篇章的方法奠定基础。汉语交叉依存现象分布调查
摘要:非投射性依存现象的正确分析是当下制约依存句法分析精确率的瓶颈问题,汉语中也广泛存在非投射性依存现象。通过调查宾州汉语树库,我们可以了解作为非投射性依存现象之一的交叉依存现象在汉语中的分布情况。如果包括因分句共享与框式介词等引起的边交叉,交叉依存有2849句,约占整个语料库15162句的16.42%。如果限定在分句范围内,1712句有交叉依存现象,约占总语料的11.29%。除去因并列关系引起的边交叉,其余现象可以分为两大类共九个小类的交叉依存使用情况。普通话水平测试(PSC)语音样本库建设方案研究
摘要:普通话水平测试(PSC)语音样本库的语料来源于国家普通话水平测试。该库以常年从事普通话水平测试的测试员为标注员,对抽样样本进行普通话语音的偏误甄别与精细标注,提供可检索的分析性反馈。标注对象涵盖声母、韵母、声调、音变、轻重音和语调、停连和流畅等方面。本文以普通话水平测试一级甲等语音样本库为例,探讨PSC语音样本库的建设思路与标注方案。汉语深层语义理解与知识表示——面向语义搜索的语料库语境信息标注研究
摘要:本文基于汉语(二语)教学语料库,面向语义搜索,分析汉语(二语)教学领域语境信息的特征及层次,探讨语料库语境信息的标注体系。本文提出语境信息标注的具体内涵和主要内容,包括语句情感类别与态度、对答结构的语义功能、语段话题信息等三类要素,在不同语言层级上讨论相关标注问题。并通过标注试验和统计分析,考察标注框架对语料的覆盖情况,以及标注信息在汉语(二语)教学与语言研究中的应用。服务于汉英机器翻译的HNC词语知识库建设
摘要:HNC的知识库系统是服务于自然语言理解处理的知识表示体系和资源建设工程。本文在HNC词语知识库的基础上,研究建立服务于汉英机器翻译的语义知识库,以解决汉语和英语在词汇、语义、句法等方面的映射问题。该知识库是汉英机器翻译引擎的核心基础资源,在汉英机器翻译系统中发挥着重要作用。面向汉英专利机器翻译的介词短语自动识别策略
摘要:专利语料中的介词短语一般长而复杂,且存在嵌套现象,不易为机器自动识别。针对专利语料的特殊性,本文提出一种基于语义分析的识别策略,汉语介词因语义功能不同而被分为两类,可根据介词语义类和上下文特征信息来制定规则,确定短语的左右边界及句法层次。测试结果表明,融合本策略的机器翻译系统在短语识别准确率、召回率和BLEU值三项指标上均得到显著提升。