文字语言的初等水平是:掌握日常听说读写的基本技能,具备语言自学能力,这些能力可以细分为:
1. 听力口语:能进行日常口语交流;
2. 阅读能力:能认识文本中90%的字,基本上能读懂文意;
3. 书写表达:能书面记录日常生活的事件;
4. 自学能力:具备自学语言的能力与信心。
国际中文教育中文水平标准,将初等分为三级,要求学习900个汉字,2 245个词语。
中文的多年多次的统计数据都支持以下的数据:
1 000个汉字,在通用文本中的覆盖率为90%;
2 500个汉字,在通用文本中的覆盖率达99%。
英文的单字量与文本覆盖率有多种统计数据,但大致相同。以下3段英文摘自一篇研究文章:(I.S.P. Nation, “How Large a Vocabulary is Needed for Reading and Listening?”, The Canadian Modern Language Review, 2006, Vol. 63, No. 1, pp. 59-81.)
If 98% coverage of a text is needed for unassisted comprehension, then a 8 000 to 9 000 word-family vocabulary is needed for comprehension of written text and a vocabulary of 6 000 to 7 000 for spoken text. (英文8 000到9 000个字族,才能达到书面文本98%的覆盖率;6 000到7 000个字族,能达到98%的口语覆盖率。)
The first 1 000 plus proper nouns cover 78%-81% of written text, and around 85% of spoken text. (常用1 000个英文单字加上专有名词,达到书面文本78%-81%的覆盖率,或85%的口语覆盖率。)
Combining the novels into one corpus gives very similar figures: 2 000 provides coverage of 87.83%, 4 000 plus proper nouns – 94.8%, 9 000 plus proper nouns – 98.24%, proper nouns 1.53%. A vocabulary of 8 000 to 9 000 words is needed to read a novel. (将这几本小说合并到一个语料库中可以得出(与报刊)非常相似的数字:2 000个字族的文本覆盖率为87.83%,4 000个字族加上专有名词为94.8%,9 000个字族加上专有名称为98.24%,专有名词为1.53%。阅读一部小说需要8 000到9 000个字族。)
以下这段英文摘自研究文章:(Batia Laufer, “Lexical Threshold Revisited: Lexical Text Coverage, Learners Vocabulary Size and Reading Comprehension”, Reading in a Foreign Language, 2010, No. 22, Vol. 1, pp. 15-30.)
We explore the relationship between second language (L2) learners’ vocabulary size, lexical text coverage that their vocabulary provides and their reading comprehension. We also conceptualize “adequate reading comprehension” and look for the lexical threshold for such reading in terms of coverage and vocabulary size... Results show that small increments of vocabulary knowledge contribute to reading comprehension even though they hardly improve text coverage. We suggest two thresholds: an optimal one, which is the knowledge of 8 000 word families yielding the coverage of 98% (including proper nouns) and a minimal one, which is 4 000-5 000 word families resulting in the coverage of 95% (including proper nouns).
(我们探讨了第二语言学习者的词汇量、文本覆盖率和阅读理解程度之间的关系。我们还提出“必要理解程度”阅读的新概念,并探寻这种阅读所需的词汇量与文本覆盖率的阈值……结果表明,词汇量的小幅增长都有助于阅读理解的提高,尽管这种小幅增长几乎不能提高文本覆盖率。我们提出了两个阈值:一个是最优阈值,即8 000个词族〔包括专有名词〕的98%的文本覆盖率;另一个是最小阈值,即4 000-5 000个词族〔包括专有名称〕的95%文本覆盖率。)
巴蒂亚·劳费尔(Batia Laufer)的研究表明,达到“必要理解程度”英文最少需要4 000-5 000个字族(包括专有名称)的95%文本覆盖率。
表 4 文本覆盖率对应汉字数与英文字族数对比表
文本覆盖率 | 中文单字量 | 英文字族量 | 英文字族量比汉字量 |
---|---|---|---|
80% | 约700 | 1 000 | 1.4倍 |
90% | 1 000 | 2 000-3 000 | 2-3倍 |
95% | 2 000 | 4 000-5 000 | 2-3倍 |
98% | 2 400 | 6 000-8 000 | 3-4倍 |
注:上面统计的是英文的字族,还不是单字。
A word family is a group of words that may share a common root word with different Prefixes and Suffixes in morphology.(字族是指一组单词,这些单词都有一个共同的词根,如:Writer, written, writing, writes, rewrite,都属于同一个字族,统计中只算着一个字族。)
因此1 000个字族,应包括多于2 000个英文单字,3 000个家族,应包括多于5 000个单字。
从上述的中文与英文的统计数据,可以看到,达到文本覆盖率90%,中文需要识字1 000个单字,单字组成很多的词组,英文需要识2 000-3 000字族(4 000-5 000个单字)。
因此达到初等语言水平,具备自学能力,英文需要学习的单字量是中文的4倍多。
当我们看到外文,或听到外语语音时,第一反应是,什么意思?我们需要的是字形与字音的意思。如果一种文字的字形与字音能有规律地表示字义,那么这种文字的学习就有规律可循,就容易学。
字形是用来表意的,字音也是用来表意的,不表意的形与音,就是没有意义。那么“形与音”表意,有规律吗?有规律,就好学,没有规律,就只能靠死记硬背,就难学。
1. 中文字母表意
汉字是象形表意文字,汉字的表意功能从字根(字母)就开始了,如:
口:吃喝品味,唱叹哭骂;
土:地坡墙城;
犭:猫狗猪狩;
氵:江河湖海。
看到汉字字形就能知道其部分字意,这是象形文字的本质特征,虽然不是所有的汉字都有这种规律性。
英文(字母表音文字)都没有表意的规律性。
第一个字母相同的英文字,字意不相关:
a: able, apple, away, after, alike, avoid;
d: day, drive, door, difficult, develop;
c: car, card, class, child, couple, cease;
h: half, hand, happen, hall, hurry.
同类意义的英文字的发音也不相关:
eat, drink, taste, flavor;
speak, talk, discuss, sing, cry, blame;
car, truck, train, taxi, ambulance;
creek, river, lake, sea, ocean, reservoir.
英文表音字母没有基本的字义,英文的音也没有规律性。
因为英文字表意没有规律性,记忆每个英文字族的字意都要死记硬背。因此英文单字比中文单字难记。
“在使用他源文字的语言里,文字同意义没有什么直接联系,语音同意义的联系也很有限(只有一些摹声词之类)。因而这‘任意性’的规律是可以基本成立的;但在使用自源文字的语言里,由于自源文字都是表意文字,文字与意义之间的联系就不是任意,而是有着必然的理据性。因此,任意性可以适用于拼音文字语言,却不适合于汉语。”(潘文国:《危机下的中文》,沈阳:辽宁人民出版社,2008年,第209页。)
2. 中文词组易学
单音节的汉字很容易组成二字词、三字词。词组的意思通过字基本上能知到。
学:学生,学习,学校,学费,学者,学期,学术,学问,学说,学业,同学,数学;
理:道理,理由,地理,心理,生理,物理,天理,推理、真理,事理,说理,整理,处理,代理,经理,总理,理解,合理,等等。
因此学会了1 000个常用汉字的听说读写,也就学会了不少于5 000个的词组,就能初通中文,完成初等中文阶段的学习。
英文就不同,中文的很多常用字词组,在英文中都是不同的字,都要一字字地学,如:
学生:student,学习:study,学校:school,学费:tuition,学者:scholar,学期:semester,学术:academic,学问:knowledge,学说:theory,学业:course,同学:classmate,数学:maths。
英语也可以把两个字组合在一起,形成词组,但英语的字是多音节,两个或三个字组合在一起,书写与发音就会很长,还不如造一个字简短些。因此英语的新词越来越多。
汉字就充分发挥了单音节的优点,中文常用字少,常用字组成的词组特别多,常用字词组丰富了中文的表述力,这是中文易学的重要特点。
从20世纪80年代以后,英文成为中国中学的必修课,高考主科,学生都要学英语,但当时英语的语音学习资源少,很多学生阅读能力强,语法好,但听力口语差,开不了口,俗称“哑巴英语”。这一现象很普遍,这也说明,听力口语与文字阅读能力相关性不大。
阅读看到的是文字的形,是“形→音义”的能力,英文的形(字母表音文字),有利于阅读时发音。但阅读能力强,阅读时的发音好,与听力口语能力,还是有区别的。
20世纪80-90年代,我国中学与大学里普遍存在的“哑巴英语”现象。
英语听说口语形成难的原因有:
1. 字母拼音文字对听力口语的技能的形成帮助不大
听力口语技能是“音→意”,“意→音”的直接反应能力,是“音与意”之间的条件反射。如果把文字放在中间,“音→文字→意”,经过文字做转换,并形成了习惯,就破坏了“音与意”之间的直接对应(条件反射),反而妨碍了口语能力的形成。
这里介绍一下我学习英语听力口语的经历,我是20世纪80年代的中学生,那时农村缺少英语教师,英语教师口语也不好,又没有收音机电视机这样的语音教学设备。听力口语的练习只是通英语音标(还读不准确)来拼读单字,念课文来进行。这样的学习方式一直到大学毕业都没有改变。
这种学习方式的特点是,练习口语就是读课文,听力也就是听自己念课文。在这听与说的过程中,都经过了文字这个中间环节,这使得我形成了一个坏习惯,即在开口说一句英语之前,脑海里先要显示这个英语句子才肯开口(意→文字→音)。听别人一句英语句子后,先要把这个句子在脑海里写出来(变成文字),再从这个脑海里的(文字)句子得到这句话的意思(音→文字→意)。
这种听力口语的学习方法,妨碍了健康快速的英语语音系统的建立,使我英语听力口语一直很差,口语听力反应速度很慢。速度快与慢,划分了优与劣。
我上面写的学英语听力口语的经历与体验,不只是我一个人的,上世纪70-80年代的中学生很多都是这样。那一代人英语文字阅读能力强,听力口语能力差是普遍现象。
现在的学生学习英语听力口语的环境条件就不同了,一是学英语从小学(或幼儿园)开始,二是教师的口语能力好,三是有电视节目,视频教程,网络英文视频等等语音训练手段,进行的是语音→语意(听),语意→语音(说)的直接对应训练,不再在中间加文字符号(音标)的过程,这才是真正的听力口语训练。
上面说了那么多,意思是,真正健康快速的语音系统的建立,应该是听力(音→意),口语(意→音)的直接训练,不应该在这个过程中加入文字符号(音标)等中间过程,如果加入了一个文字符号(音标)的转换过程,建立起来的语音系统就不是快速高效的。
外国人学中文的听力口语,也一样,不能通过拼音学习字音。
这说明了不论是什么文字,高效的口语能力形成,应独立于文字,应该避免文字的介入。所以字母拼音文字对听力口语的形成没有优势。
2. 英文的词法句法很多,有很多不规则变化
am, is, are,名词的单数复数,动词的第三人单数变化,动词时态,句子时态,一开口就要考虑很多东西,防范很多的错误。这些都让初学者开口难。
相比较,中文就好很多,你是我是他是,你有我有他有,名词没有复数变化,动词没有时态变化等等,这让学生好开口,开口时错误也少。
3. 背诵短句与常用口语句子,对听力口语能力的形成有帮助
英文字是多音节,几个英文字,可能有很多音节,背诵就难很多。汉字是单音节,几个汉字就几个音节,中文是易于背诵的。
充分利用中文易于背诵的优势,多背诵短句,有利于听力口语能力的快速形成。
初等水平的基本写作能力,学习者需要会组词造句,文字语言的词法句法的简单很重要。
1. 时间与地点的表述上的序性
中文有序,如:2023年5月19日;
一月,二月,三月,四月,五月,…十一月,十二月。
星期一,星期二,星期三,…,星期六,星期日。
表示地点:中国深圳市福田区。
英文是倒序或无序,如:19th May, 2023。
January, February, March, April, May, …, November, December;
Monday, Tuesday, …, Saturday, Sunday。
表示地点:Futian district, Shenzhen, China。
2. 人名地名:
中文只是字的组合,如:李建国,张爱红,北京,上海,广东,广西,山东,山西,湖南,湖北等等。
英语都是专有名词(Proper nouns):Dave, Christopher, London, Birmingham, San Francisco, Alabama, California, Florida, Louisiana, Texas, Utah, etc.
3. 词法句法的难易
英文有名词单复数的变化,名词所有格的变化;动词第三人称单数变化,动词时态的变化,句子在时态等等,这些都为英文造句增加了难度。
中文的词法句法简单,造句写文章就容易得多。
初等水平语言学习阶段,在单字量的要求,文字表意的规律性,听力口语,写作能力四个方面,汉字中文都比字母英文明显容易学很多,总结列表如下:
表 5 初等水平阶段,汉字中文、字母英文学习难度对比表
初等水平要求的单字量 | 文字表意的规律性 | 听力口语形成 | 写作能力的形成 | 结论 | |
---|---|---|---|---|---|
汉字中文 | 1 000 | 字形表意规律性好,字词易学 | 通过背诵短句,形成听力口语能力,容易 | 时间地点,人名地名构成简单,组词造句容易 | 容易 |
字母英文 | 2 000-3 000字族 | 字母文字没有表意的规律性,字意要死记硬背 | 字母拼音文字对听力口语的形成没有优势,难 | 时间地点,人名地名,词法句法都复杂 | 难得多 |
“很多人从小学到大学毕业,要用五分之一的学习时间学习英语,但结果却是既不能说,也听不懂,更不能写作,这充分说明拼音文字并不比汉字容易学习和掌握。”(高玉:《汉字简化理由及其反思》,《中国现代文学论丛》2018年第2期,第42-73页。)
英语是世界通用的语言,且被公认为是易学的。但从二语学习者的角度,从“入门的难易”与“完成初等水平的难易”两方面的诸多因素分析,汉字中文比字母英文易学很多。因此汉字中文是世界上最易学的文字语言。其核心原因是汉字中文是单音节表意文字,这是字母拼音文字不具备的。