從2010年1月開始,iBT的寫作評分系統(tǒng)出現(xiàn)重大調(diào)整。由原來的2篇文章各2個評分員評分,取4個人評分的算術(shù)平均分作為raw score原始分,改為2篇文章各1個評分員和1個電腦評分系統(tǒng)(e-Rater)評分,取2個人和2個e-Rater的算術(shù)平均分作為原始分。ETS研究發(fā)現(xiàn),1人1機的correlation評分相關(guān)性要好于兩個人的評分相關(guān)性,所以做出此項更改。
這是一個由ETS自主開發(fā)的作文評分系統(tǒng)。首先這個E-Rater評分系統(tǒng)首先被使用在iBT新托福考試的“獨立作文”(independent writing task)之中,也就是國內(nèi)所說的“大作文”之中。至于何時在綜合作文之中采用,ETS并沒有給出明確的說法。
這個E-Rater評分系統(tǒng),對于GRE考試來說,并不會感到陌生,因為這個評分系統(tǒng)被ETS首先用在GRE考試,它可以有效地從邏輯性、詞匯準確性上對于作文做出整體的判斷。當然就和GRE考試一樣,這次ETS在獨立作文上對于E-Rater的使用也是僅僅局限在Linguistic features(語言因素)上,僅僅用Linguistic這個單詞來解釋顯得過于單一了,我們還是來看看韋氏詞典對于“語言學(xué)”Linguistics的解釋:the study of language in general and of particular languages, their structure, grammar, and history。從這里我們可以很明顯地看到,所謂語言學(xué),也就是從語法、結(jié)構(gòu)等幾個方面來進行判斷。
在這里特別強調(diào):在使用E-Rater電腦評分的同時,ETS將繼續(xù)采用人工評分。這里的人工評分,并不是說由人工評分一次,然后再由E-Rater電腦評分一次,最后取平均值,而是E-Rater負責(zé)Linguistic的部分,然后人工負責(zé)內(nèi)容和含義的理解,最后再將兩個部分的分數(shù)相加,得到考生的作文分數(shù)。用ETS的話說,這樣得到的分數(shù),將是“難以匹敵的準確”! |