原刊:聯合報 1983.7.10p.2

大學聯考數學科考試傳出「抄襲」日本考題的疑案,連日來受到各界嚴厲批評,甚至揣測有「洩題」的可能。從學術界多年辛苦建立的令譽來看,我們不願懷疑「抄襲」的背後還有「洩題」,對命題委員適當的譴責該是「不該疏忽」,頂多只是「不該偷懶」而已。

「效度」觀點三個層次

但是,從另外一個角度,又必須指出我們所期望於命題委員的不僅是「不抄襲」、不僅是「創新」,更必須是從「效度」的觀點命題,真正能憑藉考試評鑑出適合接受大學教育的考生。

「效度」是近年各國教育學家、社會科學家認為考試中最值得重視的因素,好的考題不是困難的、不是創新的、也不是變化多端的考題、而是有「效度」的考題。

「效度」可以從三個層次解釋,第一,試題有沒有「區別力」?區別的結果穩不穩定?第二,試題能不能測出考生應具備的「特質」?第三,試題對考生未來的發展,能不能有「預測力」?

舉例來說,如果一把尺以「公丈」為最小單位的捲尺,測量人的身高,那不論大高個或是矮侏儒都不滿一個單位,這把捲尺對測量身高而言,「區別力」就不夠好,相對的,如果用一把桌用米達尺來量台北到高雄的距離,吃力不討好,「區別力」當然也不好。即使用一把適當長度的尺量人的身高,但是這把尺很容易熱漲冷縮,當然「區別力」也不好。

這個觀念引申到試題上,就是試題不必太容易,也不宜太難,要能反映考生真實的程度,而且使考生的成績呈現常態分配的情況。

「測量特質」的意思,就是我們的測量工具,能不能真正測出我們想要知道的「特質」。譬如說我們有一把很準確的尺,但是用來評定「體重」這項「特質」就不太理想。

因此,從教育的眼光看,考數學並不僅是考數學本身,而是測量考生是否具備分析能力的特質,更是測量考生目前的條件,是否和將來的所學有關連。

「預測力」是指目前測量出來程度高的特質,將來的發展是不是一定也會好?譬如多年前的少棒明星許金木,在少棒時期從身高和體重兩方面來看,稱的上「又高又壯」,但他到了青少棒時期在隊中卻變成「又乾又小」,也就是說在童年時期測量一個人的身高體重,以了解他未來體魄發展的「預測力」並不夠好。

「效度」談起來簡單,談起來簡單,做起來卻常有疏漏。譬如,美國軍方曾設計過一套測驗戰鬥飛行員的智商,也許能測出飛行員的一般軍事常識,但「有效」測出戰鬥能力的部分還不到三成。這個發現震驚了美國國防部,從此把軍方的各種考試依效度的觀點,做了很大幅度的改革。

同樣的,我國大學聯考是否符合「效度」的要求,必須切實檢討!

數學命題「效度」剖析

聯考當前的效度如何?本文探討無法面面俱到,而且以這次掀起話題的數學科為例,再縮小範圍以乙丁組的數學為例作一剖析:

第一、區別力方面,從歷年分數統計可知,乙丁組考生數學分數很少超過四十分,考及格比考個位數稀奇,「數學分數低」變成理所當然的現象。

但過了幾年,大學乙丁組的學生去考美國研究生資格考 (GRE)的時候,卻往往在數學科上得高分。

中外對比,可知我國聯考的試題太偏難了,這樣的考法最少有兩個不良的影響:一、考題沒有區別力,無法區別佔大多數的、中等程度的考生。二、由於大家分數低,造成許多考生與教師「放棄數學」的投機想法,把準備考試的時間去準備其他科目,認為反正數學差距不會很大,說不定以其他科目上「賺」回來,使得高中數學無法正常化。

第二、測量方面,又可分為兩方面,一是測量「具體應用的特質」,其次是測量「抽像分析、推理能力的特質」。

在應用方面,當前社會人文科學計量研究中,與數學有關的主要論題大約是:

1平面二元一次參數方程式:在應用時稱為相關、回歸,譬如研究公司如何進貨、出貨等。

2多元一次方程式:在應用時稱為變異數分析,譬如研究選民和選舉結果的關係等。

3機率:在應用時稱為統計推論,譬如研究如何決定品質管制的方法等。

這些數學問題其實都很簡單,也許在命題者心目中認為「太容易了」,在歷屆聯考中很少強調他們,以今年聯考為例,便一題也沒有,考生也跟著不重視。等到考生入學,開始學習計量方式以後,由於高中學習階段的基礎沒有打好,反而變得很困難。

歷屆乙丁組數學的命題方式,常是把甲丙組的考題刪除一部份,或是把複雜的數學換成較為簡單的數據,沒有考慮乙丁組考生將來就學期間,所需要接觸的數學問題和甲丙組迥然不同,沒有針對乙丁組的特質,這從「效度」的觀點來看是不正確的。

在抽像的「分析推理能力」方面,所謂「分析推理」其實是一連串的「過程」,而不是片段的記憶。但以今年乙丁組的考題而論,有一題考對數的「定義」公式、一題考「行列式」運算的定義公式、一題考「餘式公式」… ..總之,只要會背公式就會作答,這與「分析推理」幾乎無涉。

記得有一年考題,每一大題都由幾個小題連環勾串而成,第一個小題是簡單的運算,然後用第一小題的答案去解第二小題,最後再套入一個實例,這樣的考法才看見一個推理的程序,果然把「靠背題目」的考生和「靠分析能力」的考生區別開了。可惜這一種考題並不常出現。

第三、預測力方面。在當前考試方法下,如果允許我們沉痛地說,聯考的「預測力」還不能令人滿意!

譬如說近年最受矚目的經濟學家之一高希均教授,當年只考上台中農學院農業經濟系,雖然不是很差,但從聯考成績排名上預測,他將來也不是最優秀具有發展能力的學生,結果卻與事實相反。

這種情形在甲丙組也一樣,譬如獲得諾貝爾獎金的物理學家丁肇中博士自述,他當年成績平平,只考上成功大學,當然不能算頂好,美國華裔準太空人王贛駿博士,當年在附中畢業成績則有兩科不及格…我們更在報紙上讀到許多故事:在台灣不甚了了的學生,到國外卻出類拔萃。

數學考試是否「抄襲」,只關乎極少數的學生,是否在少數題目上獲益,都引起了輿論達伐,甚至勞動監察委員過問;而聯考是否有效度,卻關係到全體考生是否適才適所,我們覺得更有藉著這個新聞高潮的時期,把效度的觀念挖掘出來、高舉起來、深入探討。

增加「效度」幾項建議

如何增加聯考的效度,在此作幾項初步的建議:

--「考試」只是一個測量工具,要「視考生決定工具」,不是「設計工具來讓考生適應」。

--考試的目的是要區別考生一般程度,不是把考生考倒。考題切忌偏難、不辭簡易,要使考生感受到,每一們學科只需要適當研讀,就可以得到適當的高分,有成就動機的誘餌,才可激發考生普遍涉獵的興趣,才能引導教學正常化。

--聯考要注意「該們學科的特質取向」不必太拘泥於「該們學科內容的深度取向」,譬如乙丁組的數學考題,不應只是由數學系教授從純數學的觀點命題,更應請社會人文科學的專家學者參加,建議乙丁組考生應具備什麼樣的數學基礎訓練。

--教育主管官署該主動、大規模的追蹤調查:通過聯考的優秀學生,在校發展是否仍然優秀?入社會服務是否也超人一等?明確分析「考、養、用」之間的關係,才能夠進一步知道如何命題,才能甄試出可養、可用的人才。

學者指出,考試效度的高低,與考生、教師、出題者都有關係,但在多年來「聯考領導教學」的形勢下,命題委員的責任尤其重大,我們對命題委員得期望尤其殷切,我們尤其再三高呼:「聯考命題必須重視效度!」

回頁首 Up to page head 至頁尾 Down to page bottom
上一頁 Back to previous page 回頁首 Up to page head 下一頁 Go to nex page  
請點這裡看所有留言分類 Please click here to view categories of comments
同類別內相關主題

時事評論
公共評論
選舉評論
社會評論
媒體評論
知識評論與科普
科技評論
教育評論
法律評論
萬象現代
參考資料


美語樂學
美語樂學 語音篇
美語樂學 文化意涵篇
學美語糗記
灰姑娘計畫‧美語變身
真實美語/生活英語選_美語樂學實例
統雄美語神掌易筋經
大任務‧小使者:擔任國際客座學者的故事
看媒體‧講美語
統雄私房美語笑話
中英對照 笑話中的文化
視覺影音幽默

文學作品
統雄小說選
統雄散文選
統雄詩選
統雄戲劇/影音作品選
統雄文學批評選