|
[中国教育网记者]:
刚才李司长提到新词新语的问题,我们是否已经建立了全面的语料库?如果有了,这些数据是通过什么渠道发布的?
(2007-08-16 11:03:27)
[侯敏]:
关于新词语的问题,要想用计算机,并且用语料库把新词语自动地提写出来,实际是一个非常难的问题。今年的新词语工作,还是在手工的基础上,在我们的语言资料库中先人工提出来,再用机器输入一遍。
等到明年,比如2007年的数据,我们可能就可以真正地在语料库中用自动的方法,用自动技术来进行提取。这样,提取的时候就需要一个很大型的语料库,而且要有一个仪表。所谓新词语,新在哪儿呢?就新在它是在一定的时间段以后产生的,在这个时间段以前没有这个词,这才叫新词语。因此我们在用语料库进行提取的时候,这一段时间以前的语料要足够大,我们把它进行切分以后,把词表建立成一个比较大的图表,再和今年的进行切分,然后进行比对,这些在以前的词表中没有而今年有的就是我们提取的新词语的侯选词。在这些侯选词中还要进行人工排查,用这样的方法来提取新词语。今年我们想尝试做这个工作,但06年数据的新词语还不是计算机提取的。
(2007-08-16 11:03:45)
[王铁琨]:
目前采用的材料是新词课题组编纂的材料,目前的170多条是选目。我们感觉到,新词语研究从上世纪80年代到现在,应该有一个时代的发展脉络,目前还用这种手工操作的办法来提取新词语,显然是跟不上今天语言发展的现实。而且我们的语料也是有限的,目前大型的语料在9亿多语料中,包括15个主流报纸,十几家网站和有声媒体的大量的语料中,我们准备尝试用计算机提取的办法做这件事情。今天下午,国家语言资源监测研究中心五个分中心的同志要专门来研究这个问题,在一个比较大的语料库中把这个问题解决得好一点。
(2007-08-16 11:05:42)
[语文世界杂志记者]:
请问,据2005年和2006年的统计,发现现在汉字使用情况与以往《现代汉语常用汉字表》、《现代汉语常用通用汉字表》都有不小的出入,请问国家语委有没有打算修订这两个文字表?
(2007-08-16 11:07:09)
[王铁琨]:
目前实际用字和已有的字表发生差异,这是一个比较正常的现象,因为目前使用的《现代汉语常用字表》和《汉代汉语通用字表》都是国家语言文字工作委员会和教育部、新闻出版署在1988年发布的。1988年发布的字表,在今天已经将近20年。当时发布字表的时候主要依据的材料绝大部分还是手工操作,当然计算机也有部分参与。目前信息技术发展很快,我们用语料库来提取一些用字的实际情况已经实现了,我们可以用计算机语料库的办法来核查现在用字的实际情况。
(2007-08-16 11:07:42)
[王铁琨]:
国家语委目前正在研制规范汉字表,这项课题也是2000年国家通用文言文字法发布之后提出的一个新的任务,国家推广普通话、推行规范汉字。规范汉字究竟是什么概念?我们觉得,应该给使用文字的民众提供一个可靠的、方便的字表,要做这样的规范汉字表,就需要对以前的各种各样的字表,比如异体字整体表、简汉字总表、印刷通用汉字字形表、现代汉语通用字表进行梳理,根据实际用字的变化情况,这些变化情况对字表的修订会有一定帮助,也作为我们的参考依据。目前这项工作正在进行中,李宇明司长刚才介绍了规范汉字表,也回答了相应问题。目前学术的准备和研制已经基本结束,正在做一些行政工作。
(2007-08-16 11:08:42)
[记者]:
从2007年开始,新课程表的修订人员中增加了语委领导。我想问一下,作为语委的领导,在新课表、新教材的修改过程中,都有哪些新的举措和一些建议?
(2007-08-16 11:10:23)
[李宇明]:
新课表是修订,所谓修订,就是要根据现在的情况和发现的问题,特别是新教材试用的情况来进行。我认为,语文教育是一个非常困难的事情,它不完全是语文课或者一个课表能解决的。语文代表着一个人的生活的全部,代表着你的阅历。当前,我们都很关心我们的下一代的的语文水平问题,刚才登峰司长也介绍了关于大学生的调查,他没有公布具体的数据,如果公布了,可能更令人惊讶。对于母语的教育问题,无论如何也不能放松,再放松下去,我们的后代可能不会说话,也不会写字了,这是一个非常重要的问题。我们这次准备听取两个方面的意见,一方面是准备听第一线教材使用者的调查意见,二是要听取社会的意见,我们要召开座谈会。我们的想法是,我们的语文教学是要我们的下一代更好地过现代的语言生活,包括过好信息语言生活,也包括我们和全世界交往的语言生活,更何况我们还要接触经典、接触文化。但是我想国家语委会多方面听取意见,把意见反映给教材修改组,希望他们能够在原来的基础上更科学一点。究竟怎么样,今年年底会见分晓。他们也尽了很大的努力,希望在原有的基础上能够有所发展。
(2007-08-16 11:12:01)
|