GRE考試一直以對考生詞匯量要求高著稱。在網(wǎng)絡(luò)上搜索“考GRE需要多大詞匯量”,可以得到少則兩三千、多則兩三萬的截然不同的回答。如果仔細(xì)觀察這些說法可以發(fā)現(xiàn),其中一萬以上的答案幾乎全都是來自于主觀判斷,缺少實際的證據(jù)或理由作為支持,讓人不敢輕易相信。而兩三千的答案雖多以實際數(shù)據(jù)為依據(jù),但由于其在數(shù)據(jù)的獲取和解讀上存在諸多不合理之處,參考價值也有限。本文試圖在克服目前已有說法的缺陷的基礎(chǔ)上針對考GRE需要多大詞匯量這一問題給出一個相對而言更為可信的答案。

詞匯量的定義
在討論GRE考試的詞匯量要求之前,首先要明確詞匯量的定義,因為在不同的定義下由同一段文本可以統(tǒng)計出迥然相異的詞匯量[1]。由于英語中同一個單詞存在諸多變形(inflections),如動詞look的常見變形有looks、looked、looking,因此在統(tǒng)計詞匯量時有必要明確這些變形是否應(yīng)算作同一個詞匯。本文中除非特別說明,否則統(tǒng)計詞匯量時均只計算詞目(lemma)的數(shù)量,同一詞目的不同變形均算作同一個詞匯。因此前面提到過的look、looks、looked、looking同時出現(xiàn)時只統(tǒng)計一次,而這也是目前最常用的統(tǒng)計詞匯量的標(biāo)準(zhǔn)。此外,由于專有名詞(如人名和地名)以及過于專業(yè)的學(xué)科專業(yè)名詞一般而言也不會計入某個人的詞匯量,因此對于這部分詞匯本文在統(tǒng)計時也予以忽略。
需要注意的是,有些時候一個詞目在添加了前綴或后綴之后也有可能變?yōu)樾碌脑~目。如interest、interesting、interested由于在意思上存在較大差別,因此構(gòu)成了三個詞目。粗略判斷一個單詞自身是否構(gòu)成詞目的一個簡單方法為,如果該單詞在英語字典中存在單獨的詞條則為詞目,否則為其他詞目的變形(inflection)。如在英語詞典中可以找到interesting的詞條,但無法找到looks的詞條,因此前者構(gòu)成詞目,而后者僅為look的變形。
GRE考查的詞匯總量
在明確了詞匯量的定義之后便可以統(tǒng)計GRE考查的詞匯總量。本文以目前網(wǎng)絡(luò)上流通的諸多GRE考試真題為研究樣本,樣本共包含900余道填空題目,以及299篇閱讀文章和相應(yīng)的題目(其中93篇為邏輯單題)。
統(tǒng)計發(fā)現(xiàn),樣本中全部填空題目中出現(xiàn)的總詞匯量為6546,全部閱讀題目中出現(xiàn)的總詞匯量為6281,閱讀理解題目詞匯量為5765,邏輯單題詞匯量為2141,所有題目中出現(xiàn)的總詞匯量為9208。
其他已有的以實際考題為依據(jù)統(tǒng)計出的GRE考試詞匯量也與此大同小異。于是有人據(jù)此提出,考GRE實際需要的詞匯量不到一萬。而又由于上述詞匯量中包含了相當(dāng)一部分的大學(xué)英語四六級基礎(chǔ)詞匯,于是又有人通過簡單地將GRE題目的總詞匯減去大約6000的四六級詞匯量,得出考GRE只需要在四六級詞匯的基礎(chǔ)上再掌握大約三千詞匯量的結(jié)論。
但是這種說法忽略了一個嚴(yán)重的問題:由于上文所述的詞匯量是基于以往的考試題目統(tǒng)計出來的,因此我們只能說這一萬左右的詞匯可以應(yīng)付以往的GRE考題,但并不一定足以應(yīng)付未來的考題。因為過往經(jīng)驗告訴我們,幾乎每次GRE考試都會考查以往考試中沒有出現(xiàn)過的新詞。因此除非我們用作統(tǒng)計樣本的題目數(shù)量足夠多,多到其中涉及到的詞匯可以覆蓋到未來考試中所有有可能出現(xiàn)的詞匯,否則應(yīng)對未來GRE考試所需的詞匯量應(yīng)大于基于現(xiàn)有題目的統(tǒng)計結(jié)果。
GRE詞匯的難度
上述計算GRE所需詞匯量方法的另一個問題在于其在統(tǒng)計時沒有考慮GRE詞匯的難度。比如我們先來看下面這道GRE官網(wǎng)上的填空例題:
In parts of the Arctic,the land grades into the landfast ice so______that you can walk off the coast and not know you are over the hidden sea.
(A)permanently
(B)imperceptibly
(C)irregularly
(D)precariously
(E)relentlessly
(答案:B)
這道題目中出現(xiàn)的詞匯量為29,那么請問如果只是為了做對這一道題的話,一個考生需要有多大詞匯量?答案顯然不會是29。因為這道題目中出現(xiàn)了眾多高難度詞匯,在正常情況下任何一個詞匯只有29的人都不可能認(rèn)識選項中的這五個單詞。
不論是母語者還是外語學(xué)習(xí)者,人們在學(xué)習(xí)詞匯時整體上都是先掌握常用詞匯,然后才能掌握生僻詞匯。由于這一正常詞匯學(xué)習(xí)的規(guī)律,又由于GRE考試經(jīng)常考查極為生僻的詞匯而很多常用詞匯反而不考,導(dǎo)致一個考生只要當(dāng)其實際掌握的詞匯量顯著高于GRE實際考查的詞匯量時才有可能認(rèn)識考試中出現(xiàn)的生僻單詞。因此要回答考GRE需要多大詞匯量這一問題,更合理的思路應(yīng)是從GRE詞匯的難度著手。
最能反映詞匯難度的指標(biāo)是詞匯的生僻程度:越常見的單詞越容易被使用者掌握,而越生僻的單詞使用者掌握的可能性也越小。本文以當(dāng)代美語語料庫(Corpus of Contemporary American English,COCA)發(fā)布的單詞詞頻數(shù)據(jù)作為計算單詞生僻程度的依據(jù)。COCA為目前世界上最大的英語語料庫,其中收錄了總計超過4.5億字的文本,可以很好地反映出英語的實際使用情況。COCA發(fā)布了六萬余個詞目、總計超過十萬詞匯(包含詞目的變形)的詞頻數(shù)據(jù)。其中最高頻的5000詞目均為日常表達(dá)常用詞,而詞頻排名在10000以后的詞目則大多出自書面表達(dá)。根據(jù)流行的詞匯量測試網(wǎng)站testyourvocab.com的統(tǒng)計,大多數(shù)母語者的詞匯量在20000-35000之間,極少有人詞匯量超過40000。
本文直接將單詞所屬詞目在COCA中的頻率排名作為詞匯生僻程度的指標(biāo),不做任何換算。數(shù)字越大表示單詞越生僻,最大為63145。按照這一標(biāo)準(zhǔn),單詞look難度為76,abandon難度為2203,上面例題中E選項的relentlessly難度為10098。于是我們可以這樣估計考GRE所需的詞匯量:考生解題需要認(rèn)識的所有詞匯中的難度最大值即為所需詞匯量。因為理想情況下學(xué)習(xí)者掌握詞匯的順序應(yīng)完全與其詞頻排序一致,于是當(dāng)考生的詞匯量為N時,應(yīng)剛好認(rèn)識題目中難度小于等于N的所有單詞。雖然現(xiàn)實中學(xué)習(xí)者不大可能會完全按照詞頻順序掌握每個詞匯,但據(jù)此推算出的所需詞匯量與實際的所需詞匯量不會相差太多。