PISA評量對我國教育的省思

撰文◎吳書銘(國立臺灣師範大學─教育學系博士班研究生)


壹、前言
  學習品質的確保,是近年來各先進國家教育發展的重點,為了維持學校教育的品質,各國紛紛進行了「基本能力」或是「基本素養」的評量,如PISA測驗與TIMSSPIRLS,這些都是讓各國有機會瞭解自己國家學生的學習成效,以及和他國交流教育經驗的機會,得以此作為比較基準來檢視學習成效與教育政策,也為我國教育政策提供了良好的參考工具。然而,無論是哪一項國際性學生評量,由於我國受分數至上、菁英主義的意識形態作祟,使得分數的重要性已遠遠超過原先只為檢視學生學習成效的原意。另一方面,部分教育組織亦利用學生評量的結果來證明或強化自身教育理念的工具,例如:PISA閱讀成績的低落,使得部分人士提出,應去除過去文言文教材在課程中的重要性,而改為白話文學或臺灣文學;國中基本學力測驗也是從最初的檢視學生學習成效原意,移植至我國後,卻變成了最重要的入學參考指標。

  無論如何,學生評量應是一種協助與輔導的機制,最主要的目的是讓學生透過測驗瞭解自己的學習困難,並從測驗結果中得以學習到他人的優點,而教師也能透過測驗瞭解到教學及課程的效果,以此訊息來回饋檢視最初的教學目標是否達到。最後,以鉅觀的角度,對整體國家社會的教育競爭力做出分析,和其他世界先進國家作出良性的比較和互動,進而強化我國人力優勢。

貳、OECDPISA的緣由
PISA係經濟合作暨發展組織(Organisation for Economic Co-operation and Development,簡稱OECD)所委託的計畫,以跨國性的研究型態展現參與國十五歲學生在閱讀、數學、科學領域上的學習成就。
  在OECD中,教育相關的執行事務處包括四個獨立的部門,這些組織的運作基金由參與國來分攤。這四個組織包括:教育研究與創新中心(CERI)(半自主機構)、高等教育制度管理部門(IMHE)、教育建築部門(PEB)、國際學生評鑑部門(PISA),而這四個部門致力於完成教育專業委員會所規劃的策略性教育目標。
  PISA是研究所有的30個會員國及將近30個合作國中,學生是否已具備能力來面對未來的生活?是否已有能力且有效的去分析、思考和表達分享他們的想法?他們是否有素養去學習思考人生?

【表 OECD各教育部門名稱對照表】
教育部門名稱
教育部門中文名稱
縮寫名稱
Centre for Educational Research and Innovation
教育研究與創新中心
CERI
Program on International Management in Higher Education
高等教育制度管理部門
IMHE
Program on Educational Builing
教育建築部門
PEB
Program for International Student Assessment
國際學生評鑑部門
PISA
資料來源:引自吳慧子、張鈿富,2006

參、PISA的主旨
每次PISA測驗會從閱讀、數學、科學三個領域中選定主要領域,另外二個次領域較未深入評量,例如:2003為數學,2006為科學,故2009的主要領域又回到閱讀,每九年形成一個大循環。
  PISA國際評量計畫(The Programme for International Student Assessment,簡稱PISA)是由經濟合作暨發展組織(Organisation for Economic Co-operation and Development,簡稱OECD)所委託的計畫,以跨國性的研究型態出現,OECDPISA代表著對人力的檢視,藉著與OECD國家的合作,監控教育系統中學校及學生成就方面的產出,特別是針對學校或教育系統有相同之輸入,但結果卻不同的現象,提供反省的功能。此外,OECDPISA也將提供一個國際層級教育系統效能的評量與監控。PISA於一九九○年代末期開始對十五歲學生的數學、科學及閱讀進行持續、定期的國際性比較研究,測試十五歲學生是否具備參與未來社會所必需的基礎知識和基本技能,為各國制定教育政策提供參考,以此來審視、評估國家及學校教育的整体成效。
  每次評量會從數學、科學及閱讀三個領域中選定一個主要領域,賦予較多的重要性,另外二個次領域較未深入評量。PISA 2000的主要領域為閱讀,2003為數學,   2006為科學,故2009的主要領域又回到閱讀,每九年形成一個大循環。
  PISA 2000200320062009的資料蒐集負責機構為澳洲教育研究委員會(Australian Council for Educational Research,簡稱ACER)主導的國際性組織。
  目前五十七國參與評量,我國於二○○六年第一次參加調查,二○○七年四月中旬開始抽測,臺灣分成北中南東四區,依各區學生人數比例抽出了240所學校,受測學生共計8,815位(到考率97.75%);其中包含了國中、五專、高中、高職(包括實用技能班與建教合作班)及進修學校;每校受測學生會被分配到13種不同的題本,3科共考2個小時。

肆、PISA評量領域的內涵
  PISA是一項以年齡為導向的調查研究,採取素養(Literacy)的觀點設計測驗,測驗的內容主要分為三個領域:閱讀素養、數學素養及科學素養。重點在於評估接近完成基礎教育的十五歲學生,是否能將在校習得的知識與技能應用於進入社會後所面臨的各種情境及挑戰。換句話說,PISA所評估的是學生對於日常生活中可能接觸到的各種文書資料,運用其閱讀能力所能達到的理解和詮釋的程度;運用數學知識和技能去解決數學相關的難題及挑戰所能達到的程度;以及運用科學知識和技能去瞭解、解釋和解決各種科學情境及挑戰所能達到的程度。這三種素養不僅是學校課程的核心,也是成人社會所需具備的重要知能。

一、閱讀領域
  「閱讀能力」在解釋、使用與反映文字的內容,以便達成個人的目標、發展個人的知識、潛能及社會的參與。評量要求學生在閱讀不同種類的文章後,完成一系列不同類型的作業。閱讀能力的組成與領域面向包括:閱讀不同種類的文字內容,例如:連續散文、文告及結構不同文體。表現不同種類的閱讀任務,例如:回憶特定的資訊、發展一種解釋或是反應文字的內容。是否能閱讀因不同情境而寫作的文字內容。作業的設計要求學生對文章有深入的瞭解和詮釋。評量所採用的文章除包括一般文章外,還包括清單、圖表、表格及操作說明書等。
二、數學領域
  數學領域的評量包括普通的計算及數學思考與分析能力,在確認、瞭解與從事數學以及透過數學在世界扮演的角色能作成良好基礎的判斷,並協助個人就目前與未來生活所需,做一個建設性、關懷心與反省性的市民。數學能力的組成與領域面向包括:數學內容─主要是數學的「大概念」、模式與問題解決,以及數學在不同情境中的應用。此外,亦會測量學生能否應用機率、空間及圖形、量化推理等數學概念,同時也會涵蓋其他比較深入的範疇,如代數及幾何等。

三、科學領域
  科學領域的評量要求學生應用科學概念瞭解及判斷自然界的現象,還測量學生對科學問題的辨別能力,是否懂得運用證據作科學化的推論,在結合科學知識與證據本位結論的形成,以及發展相關假設以瞭解與協助作成自然世界有關的決定,並且透過人類活動來促成改變。評量所測量的科學概念與學生身處的世界有密切關係,這些概念包括科學日常生活、健康、環境和科技各方面的應用。科學能力的組成與領域面向包括:科學概念、科學過程技巧及不同情境的科學應用。(張鈿富等人,2006

伍、2006臺灣PISA表現成就分析
一、閱讀方面
我國閱讀成就高分群表現不如前段國家與參與國總平均,低分群表現尚可,但仍需加強。另外,學校課程節數、各科學習時間的排擠、作文與文言文教學比重的降低,都可能影響我國PISA閱讀領域的表現。
閱讀能力不佳:
我國閱讀領域方面,無論是最高級(Level 5)或是高分群(Level 5+Level 4)學生比例,皆遠較前段國家為低。我國閱讀高分群部分為26.3%,低於韓國的54.4%、芬蘭的48.5%、香港的44.8%、瑞典的33.9%,甚至也低於高我國一名次的日本  30.9%OECD國家平均的29.3%,顯示我國學生在閱讀領域表現不佳的嚴重性。而在低分群部分(15.3%)雖比OECD國家平均(20.1%)及日本表現(18.4%)為佳,和瑞典(15.3%)表現差不多,但仍在人數比例方面遠高於芬蘭的4.8%、韓國的5.7%、香港的7.2%
學習時間的排擠效應:
當前的教育政策多有不利於學生閱讀及國語學習之處,吾人認為有以下幾點因素:第一,九年一貫課程推行至今,由於英語及母語課程的大力推動下,使得現今的國語(國文)課皆較過去上課時數為低,國小國語課從10小時減半、中學國文課則從6小時減為4小時;第二,我國在升學主義興盛、補習風氣的高漲的影響下,學生的課後補習行為也會大大壓縮到學生在課後進行課內外閱讀活動的時間;第三,升學考試中的作文部分愈來愈不受重視,已漸漸減低其占分比重,甚至只被入學學校作為審查學生的門檻;第四,過去教育部與學界人士的文言文之爭,也凸顯出了目前語文學習的忽視,以及語文學習內涵的降低情形。

二、數學方面
數學整體分數第一,但低分群學生亦不少,標準差為各國中第三大,有分數雙峰化的現象。從TIMSS的分析中得知,我國學生數學成就與其課後補習時間呈正向相關。
是否仍存在雙峰現象:
臺灣總體分數第一,但程度最低的學生(Below Level 1)的比率較第二名芬蘭、並列第三名的香港、韓國還多,程度次低部分(Level 1)亦如此;程度最佳(Level 6)與次佳部分(Level 5)卻都名列各國之首。在前四名裡面,芬蘭的成績分散程度最小:標準差81,香港和韓國都是93,而臺灣最大:103,這是PISA 2006數學測驗中第三大的標準差!這些數據是否與學者提出雙峰化(M型化)的現象有關,仍需要日後進一步研究與論據來證明,但也警惕我們必須正視此問題。
課後補習對數學成績的強化作用:
亞洲國家學生運用了非常多課後時間在補習活動上面,另一個國際性學生評量測驗(TIMSS),針對了我國八年級學生所做的數學測驗及背景相關分析(學生一週中花在課後數學補習的時間),顯示我國補習活動確實是能夠有效提昇學生的數學科學習成就,因此即使我國在PISA測驗上得到了參與國家中的第一名,仍然不宜將成就完全歸於教改活動及課程的編寫上,反而應該更去瞭解我國學生在補習行為或其他原因與PISA測驗之間的相關程度。

三、科學方面
我國整體科學領域表現頗為收斂,然學生在論證思考題目上需加強,或與自我後設認知及東西方文化差異相關。
科學領域低分群呈現收斂情形,高分群則有努力空間:
與前三名國家得分相較(芬蘭3.9%、香港2.1%),我國學生在最高分群的得分表現(1.7%)並不耀眼,甚至低於第五名的日本(2.6%);高分群方面(Level 5Level 6)也以14.6%低於芬蘭的20.9%和香港的16%、第五名日本的15%;但是Below  Level 1的學生卻僅有1.9%,優於第三名加拿大2.2%、韓國的2.5%,以及日本的3.2%,顯示我國學生成績分布頗收斂。
細部分析結果:
臺灣學生解釋科學現象的能力最強,排名全球第三,但要以證據反駁他人意見的科學論證能力則掉到第八名,思考發展科學題目等形成議題能力更弱,只有十七名。而此兩項能力較低,有兩項可能因素:第一,跟我國教育現場較少讓學生實驗練習、上台報告、交叉討論有關;第二,和PISA測驗中,我國學生在閱讀領域能力較不佳情況有可能相關,因為閱讀、文字轉化、口語表達都和科學的論述能力有關。
臺灣學生在科學自我能力概念指標上明顯低於其他國家,代表自信心不足,包括「正確回答科學課題」、「很快瞭解科學課程概念」、「很快學習科學議題」、「很快瞭解科學新概念」、「學習進階課題很容易」、「學校科學課題是容易的」等,臺灣學生在所有指標的同意程度都低於各國平均值,此調查顯示出了兩種可能:第一,學生在科學領域的學習大多是被動地接受教師的教導,尚未達到自我「後設認知」的程度;第二,東西文化的差異,我國學生在於自我概念的表現不如西方學生來得強烈,因而趨向保守回答。

陸、PISA評量下的教育省思
  PISA測驗結果,提供了許多我國十五歲學生在閱讀、數學、科學三個領域方面的珍貴資料,讓教育當局及社會大眾都瞭解到我國學生學習成果在全球中的定位,並且透過學生問卷及家長問卷的結果分析,也能使我們瞭解學習成效與家庭背景的相關程度;然而過多的資訊集中於各科領域成績,使得我們可能忽略在PISA測驗背後更應關心的家庭、社會、教育經費等層面,甚至是對於PISA測驗此國際性學生評量的整體反思,以下吾人便針對PISA制度及評量結果給予我國的教育省思進行闡述。

一、PISA測驗給予我國的教育省思
家庭背景對學業成績的影響程度。
外來移民或族群間不同文化背景的學生能力差異。
男女有別的能力差異情形。
國家內地區性、使用母語差不同所造成的成績差異。
能力分班對於提昇學生能力無益。
促進政府積極做出國際性比較。
家庭背景對學業成績的影響程度:
奧地利的PISA報告中,顯現出社會階層的排擠效應,學生的家庭背景直接影響了學習成效,他們的結果顯示了「社會地位對於學習成效及教育機會的影響極大」。我國在PISA測驗中,包含了各種學校體制的學生(包括國中、五專、高中、高職實用技能班、建教合作班及進修學校),同一年齡層(15歲)各類型學生皆能涵蓋,因此有關單位應盡快瞭解PISA成績與學生背景問卷中所呈現出的相關程度。
外來移民或族群間不同文化背景的學生能力差異:
奧地利的PISA報告指出移民家庭的學童有很大的學習障礙,有10%的學生在三個領域中同時都處於學力低落困境之中,並且移民第二代閱讀能力不如移民第一代的情形。此情形可能代表文化認同問題正在外來移民家庭的教育內容中發酵,尤其是在閱讀方面的表現。另外,文化差異使學生在學習歷程中產生的消極、抗拒情形也是值得注意,因此在我國婚姻日漸走向「國際化」的同時,也必須瞭解到,新移民家庭中父母親的親職、識字教育及其子女的雙邊文化認同議題的重要性。
男女有別的能力差異情形:
我國與加拿大都提出對於性別間能力差異的發現,並且研究結果都顯示了男性的科學與數學表現都高於女性,而女性的閱讀表現皆高於男性的結果。雖然結果皆未達顯著差異,但是卻符應了長久以來我們對於男女能力差異的刻板印象,而此結果究竟是性別間的先天能力偏向,還是後天的家庭期望、教育資源、自我預期所導致的現象,仍需要未來密切關注。
國家內地區性、使用母語差不同所造成的成績差異:
加拿大的研究報告重點中提到,各省分學生能力在一些領域中有明顯的差異,例如:以法語為母語的學生並未如比以英語為母語的學生表現要好;比利時也發現,法語區學生普遍較荷語區學生表現要差,甚至進步幅度也較小,凸顯了比利時語言文化體中教育不平等的現象。
相較於我國,母語的分布也是具有明顯的地域性差異,如外省籍學生、桃竹苗的客家族群、中南部的閩南族群、東部的原住民族群等,即使過去我國極力希望在課程上作出平等的規劃,藉由規劃出共同且普遍的課程來促進學生能力的均衡,但是各地區的學習成效仍是存有差異,因此未來我國教育當局仍需思考,學生成績的差異究竟是來自於使用母語的不同還是各地區經濟能力或教育資源差異所造成的地區性學習成效落差現象。
能力分班對於提昇學生能力無益:
PISA另一重大發現,是愈早能力分班的學校,學生平均表現愈差,家庭對於學童學習成效的影響愈大,對社經背景較差的學生愈不利,社經背景較差者的孩子會被提早排除,失去公平學習、競爭的機會,其可能原因是學校都把資源集中在前段班,而波蘭政府在一九九九年結束學生早期能力分班傳統,成功完成教育改革後,也被OECD統計專家發現,波蘭學生在學業成績上的顯著成長,驗證了早期分班策略不僅傷害成績不佳學生,也無法嘉惠其他學生,而以上結果等於也肯定我國多年來在常態編班政策上的努力。
促進政府積極做出國際性比較:
PISA成績的產出,給予各國教育有了借鏡學習的機會,從上課時數與評量成績的效益比來看,同樣十四歲學生,芬蘭學生一年上課時數只有815小時,日本則有875小時,我國更是高達997小時,因而不得不令人去深究芬蘭學校教育,其效益之高的原因為何;另外,臺灣國中階段的每班學生數明顯高於其他領先國家,例如:香港每班29.8人,芬蘭每班學生數更僅1025人,臺灣卻仍然高達34.1人;這些數據上的比較雖然過於量化,而不見其教學內涵,但仍是值得我國去加以深思之處。

二、對PISA制度施行下的批判反思
題目設計必須顧及各國社會文化特質。
切勿以評量成果而對多軌教育制下的技職學校有偏誤看法。
各國欲短時間提昇PISA測驗成績的隱憂。
全面性解讀資訊的能力。
題目設計必須顧及各國社會文化特質:
PISA測驗的題目設計必須要偏向大眾化,不宜有凸顯某一國家的課程特徵於其中,特別是在閱讀領域中,閱讀內容必須符合各國學生普遍可知的描述特質,如美國在二○○六年的PISA測驗中閱讀領域,最後因為美國教育當局認為學生對於題意有所誤解,將造成成績受影響,對排名不公,最後退出了閱讀領域的比較。因此,題項與題意的設計必須嚴謹,否則可能落入奧地利學者HopmannPISA的批評:「PISA的排名就好像是用歐洲歌唱大賽來評鑑一國的音樂文化」,他認為PISA測驗是主觀性強烈的評量活動。
切勿以評量成果而對多軌教育制下的技職學校有偏誤看法:
奧地利的報告中提出了一點:「在奧地利實施的多軌教育制度之下,學生的學力並沒有較差,也沒有比較好」,來表示在實施多軌制前後,學生在PISA評量結果的無差異情形。然而,我們必須要注意到各種後期中等教育機構的教育目標(包括五專、高中、高職實用技能班、建教合作班及進修學校)是不同且特殊,但PISA評量的測驗內容卻是較有利於一般學術取向學生的學力表現,而非著重技職教育的學習內涵,因而並不宜直接以PISA評量的結果來評斷多軌制教育下各類型學生表現的優劣。
各國欲短時間提昇PISA測驗成績的隱憂:
在PISA評量施行之後,各國都希望透過這個國際性的測驗來瞭解自己國家學生在學習成效上的競爭力為何,但是PISA組織也表示,排名只是作為參考,名次實是過於簡化的數據,重點是在於各個國家內部中,教育相關變項間的檢驗,例如:社經背景或教育經費。
然而,部分國家卻希望透過課程或考試制度的改變來達到令人滿意的PISA成績,例如:美國希望提高全國性數學測驗的難易度,來加強學生對較高深數學知識的學習;我國也有人提出應該要像香港一樣,降低教材中文言文的比重,來提昇學生閱讀能力及學習興趣。
而吾人認為,美國數學成績及我國閱讀成就並不能僅單一地參考PISA成績,就否定過去長久以來的教育型態,因此美國也擔心加入國際測驗所帶來的高度考試壓力,會對其國內的正常教學內容造成反效果。因此,各國應該要更為謹慎的尋找其他相關的影響因素,如教學方式、教育時數等,否則可能又會落入另類的「考試領導教學」危機之中。
全面性解讀資訊的能力:
PISA評量提供最重要的訊息不是排名,而是成績背後各項指標與成績的相關性,以我國二○○六年結果表現為例,班級人數過多可能影響學生輔導與親師溝通的品質,更有可能擴大階級差距。我國公部門教育經費方面,PISA 2006統計報告顯示:各國GDP及教育投資較高之國家,其科學測驗表現成績較佳。另外,其二○○七年「Education at a Glance」統計資料顯示:二○○四年各國公部門教育經費占  GDP的比例,臺灣4.29的投資比率明顯低於2006 PISA表現優於我國的前三名國家,例如:加拿大為4.88,而芬蘭更高達6.0。因此,類似以上的訊息,才是我國參與PISA應關注並改進之處,故未來各界應以專業角度解讀,並利用PISA結果,使該測驗成為國家教育發展的實質助力。

柒、結語
  許多政府相信透過PISA這套以資本優勢國家課程為主設計的「公平測驗」,可以測出國家的競爭力,但代價卻是必須以犧牲本國文化與課程自主來交換。全國教師會指出:PISA設計的背景與方法,是根據OECD及其西方文化背景設定的教育目標和能力定義所設計的,若完全以PISA作為國家發展方針,將進一步促使臺灣教育文化被西方價值統一,而失去本土主體性和教育發展脈絡。此外,各國教育目標也會因此被限縮至全球化一元趨勢中,而無法貫徹多元與積極尊重的教育價值。
  臺灣近年在全球化的潮流下,符應前述資本主義的立場不難理解,但政府忽略的是,犧牲課程自主性來透過全球競試獲取能見度的結果,除了加速高級人力外移,更可能忽視臺灣長久以來努力建立的在地教育價值。故PISA測驗分數的解讀與因應,近來多有人提出檢討,使用者若是只為表面測驗結果的好壞而滿足或貿然改革,便是誤解了PISA的真正功能。



參考書目
王瑞壎(2002)。OECD組織PISA評量對國小數學與科學教育之啟示。科學教育研究與發展273955
朱啟華(2003)。德國的PISA研究。教育研究月刊112153163
吳慧子、張鈿富(2006)。2006 OECD概況及其推動的教育方案之探討。臺灣教育研究的回顧與展望論文研討會論文輯155184
張鈿富、王世英、吳慧子、周文菁(2006)。基本能力評量跨國發展經驗之比較。教育資料與研究687999
張殷榮(2001)。我國國中學生在國際測驗調查中科學學習成就影響因素之探討。科學教育月刊244510
張淑媚、朱啟華(2008)。德國對PISA的討論及對談臺灣教育的啟示。教育資料集刊225240
臺北駐日經濟文化代表處文化組(2005)。學習熟練度世界第一之芬蘭對於日本之反映感到很困惱。朝日新聞,2005221日。
中華民國全國教師會新聞稿(2007)。有關PISA臺灣成績結果本會評析新聞稿2008413日,取自:http://forum.nta.org.tw/v362/showthrea d.php?t=2729
歐盟兼駐比利時代表處文化組(2004)。比利時法語區學生表現略有進步荷語區學生表現不俗。自由比利時日報La libra Belgiqu2005110日。
駐舊金山臺北經濟文化辦事處文化組(2005)。美學童國際數學測驗成績落後其他國家。教育週報,200515日。
駐加拿大代表處文化組(2004)。加拿大學童在數學科學閱讀及問題解決能力方面表現優異。加拿大OECD PISA研究報告,20041228日。
駐美文化組(2008)。美國教育界呼籲各州評鑑制度比照國際標準。美國教育週報Education Week2008312日。
駐芝加哥文化組(2007)。OECD國際學生能力評比報告出爐。經濟學人The Economist2007128日。
駐奧地利代表處文化組(2006)。教師為下次的PISA評鑑作準備。報紙die Presse2006224日。
駐奧地利代表處文化組(2007)。學者批評對於PISA評鑑有錯誤的看法。奧地利新聞報,20071112日。
駐奧地利代表處文化組(2007)。PISA評鑑家庭背景的影響大於學校類別。奧地利新聞報,2007124日。
中國時報(2007)。學者閱讀弱應調整教育政策2007125日,A8版。
中國時報(2007)。教育部該回到本業了吧20071211日,A2版。
自由時報(2007)。臺灣學生數學高分群多2007125日,A3版。
聯合報(2007)。學者數學補到第一犧牲閱讀更糟20071210日,C3
聯合報(2007)。PISA評比我十五歲學生數學能力冠全球2007125日,A5版。


沒有留言:

張貼留言