◆各項AI工具的答案將愈來愈精準,將會對中學教育及考核帶來極大衝擊。圖為去年文憑試的一個試場。 資料圖片
通識答題
中史答題
◆鄧飛直言,生成式AI工具對中學教育與學生的學習行為和質量都一定會帶來衝擊。 香港文匯報記者萬靈霜 攝

文匯報實測不足一分鐘答完 教育界憂影響校本評核結果

人工智能(AI)工具ChatGPT自推出以來引起廣泛討論,在教育界更引發激烈爭議,海外及本港先後有大學禁止學生於課業中使用AI工具,同時亦有大學持較開放及積極的態度。事實上,除了大學外,生成式人工智能工具對基礎教育以至公開試發展也同樣帶來挑戰。

一年一度的中學文憑試(DSE)在今日(21日)開考。香港文匯報針對主要以文字答題的通識科和中史科考試,日前讓ChatGPT作答2022年兩份考卷的選答題,並分別邀得本港資深教育界人士為答案評分。結果顯示,ChatGPT在不足一分鐘時間內,通識科能取得足夠升讀大學的3級成績,而中史科考試更獲評5級佳績。教育界人士表示,雖然公開試的試場監考形式暫不會受ChatGPT影響,但AI工具能輕易取得不遜於一般學生水平的成績,可能會影響校本評核的結果。同時,隨着各項AI工具的「進化」,答案將愈來愈精準,將會對中學教育及考核帶來極大衝擊。 ◆香港文匯報記者 金文博

未掌握通識卷應試要求

香港文匯報日前選取了2022年DSE通識科卷二延伸回應題第一題予ChatGPT回答。該題目提供了三項關於虛擬祭祀、電子紅包及環保中秋的資料,要求考生根據資料1)回答並解釋網上祭祀有哪些好處,及 2)表態並論證在多大程度上同意,在現代社會實踐中國傳統習俗時應優先考慮環保。

在首部分中,ChatGPT的答案驟眼看頭頭是道。它提出了網上祭祀可減少環境污染風險,同時方便遠離香港的家人和朋友參與紀念,表達對先人的思念和禮敬,同時促進家族間的聯繫和交流。在第二部分,ChatGPT表明同意環保因素應優先考慮,及列出三個支持理由,包括「保護環境是我們的責任」、「現代科技提供了一些環保的替代方案」及「環保是對下一代的責任」,並嘗試逐一說明。(問答全文請掃碼)

香港文匯報邀請資深通識科老師、立法會議員鄧飛為答案評分。他表示,在共佔8分的首部分中,有關答案可得到6分相等於4級的成績,但ChatGPT所提供的答案未有理會題目提供的資料,只用「常識」作答。

缺正反兩面論述

佔12分的第二部分,評分則為僅僅合格(2級),兩部分合計大約可得3級。鄧飛解釋,題目中的「多大程度上認同」除了要求明確回答認同與否的程度,還要求考生從正反兩面論述對比,不應只說出一方面的觀點。在ChatGPT答案中,只說出支持優先考慮環保的理由,卻沒有從反面說出質疑的理由,並不符合考試要求,所以只能僅僅合格。

他表示,從答案分析,ChatGPT最大的問題在於未能掌握應試及題型要求重點,因為有些答題技巧未必是從試卷題目中字面顯示,而是通過日常教學及考評局與前線老師溝通等所得。

鄧飛表示,根據目前的資料顯示,ChatGPT及其他AI工具尚不知道考試要求,即使以它來作弊,可能只得到合格的分數,對學生考試「出貓」誘因看似有限,然而不能排除若將來各項AI工具能進一步「掌握」考試的答題要求,只要輸入仔細的問題指令後,就可能提高答案準確度。 ◆香港文匯報記者 葉子之

中史答卷全面 援引稍不足

香港文匯報日前向ChatGPT發問了2022年文憑試中史科試題卷二單元三「時代與知識分子」的第七題。題目提供了兩份資料,包括孔子輔佐魯定公和齊景公會盟的「夾谷之會」,以及孔子處理魯國中三家擁「百雉之城」貴族的「墮三都」事件,要求考生論析孔子1)對魯國外交和內政的貢獻,和 2)如何從周遊列國、講學授徒和整體典籍三方面實踐政治理想。

ChatGPT在答題時,依照了問題所指的外交和內政,及周遊列國、講學授徒和整體典籍三方面點列說明。其間,記者曾指示ChatGPT「tell me more」,它在短短一分鐘內一舉回答了2,000字內容(問答全文請掃碼)。

香港文匯報記者邀請到教聯會副主席、中史科教師穆家駿為有關答案評分,單以該題而言,ChatGPT獲評DSE 5級水平,表現較通識卷為優。

就問題第一部分而言,穆家駿表示,ChatGPT能引用資料中有關「夾谷之會」的文字和史實,分析孔子的外交貢獻,惟在內政方面單純參照資料,沒有引用史實解釋「百雉之城」的意思和意義,以及孔子如何對付季孫氏、叔孫氏和孟孫氏這三個僭越自擁「百雉之城」的魯國卿大夫,因此只能獲得10分中的7分。

善用AI輔助 而非倚賴

在第二部分,穆家駿表示,ChatGPT大致能夠從周遊列國、講學授徒和整理典籍三方面回答題目要求,只是在史實援引方面稍有不足,例如並沒有提出一些著名例子,來析論孔子如何透過講學授徒來實踐政治理想,包括其門下出了子路、子貢等後來都投身政治的學生等,「其餘整體的表現都不錯」,因此可獲15分中的13分。

就ChatGPT等生成式AI對於中學教育帶來的衝擊和影響,穆家駿認為,很多情況下若學生只是利用AI工具作「頭腦風暴」(brainstorming)之用,教師與學校確難以分辨,因此重要的是教育學生怎樣善用AI輔助自己學習,而非完全倚賴AI作答,自己卻完全不用腦去思考。

鄧飛:對文科或有利 理科恐冇着數

ChatGPT等生成式AI工具的誕生和不斷發展,鄧飛直言,它們對中學教育與學生的學習行為和質量都一定會帶來衝擊,尤其是對語文科、人文社會學科及商科等影響更大。由於學校不可能要求學生留校在老師的監督下完成所有功課,因此當他們在家做功課時,就有機會利用AI工具「精準地、聰明地作弊(smart cheating)」,例如將AI工具給予的答案進行撮寫,或是花費心力對它問出精準、仔細的問題,以獲得滿意和符合功課要求的答案。

鄧飛表示,對理科知識和運算思維,如果學生平時透過生成式AI工具直接把題目輸入,很快就可以獲得答案,「但是當到了考試、測驗時就一定會『現形』,不懂得作答。」然而,如果學生於語言及社會人文科目利用AI工具,卻不一定會有「現形」的情況,因為他們平日在「精準地、聰明地作弊」的時候,可能不知不覺中磨練出相當程度的語言和社會人文素養,這樣他們的考試表現或比平日稍為遜色,卻未至於會「現形」、「交白卷」。

可能破壞師生間信任

在談到ChatGPT等生成式AI工具對學校帶來的衝擊,鄧飛指出,其中一個重大挑戰在於,中小學較難像大學般設置專門軟件程式去檢視、偵察學生的功課是否具有抄襲、作弊或經過AI生成的成分,因此要迫不得已做最壞假設,可能會將功課改成頻繁堂課和測驗,以確保學生有真正去學習而非倚賴AI。這樣做的代價就是,一方面會擾亂學校的教學秩序,「什麼時候家課、堂課、小測、大測和大考的規律會被打破,而頻繁地測驗也會增加學生的應考壓力,對心理健康可能造成負面影響。」另一方面,也會引致師生間互相防備,破壞彼此間的信任。

鄧飛認為,ChatGPT亦可帶出「智者問得巧,愚者問得笨」效果,對教學有相應好處,「學習的關鍵就是要懂得『問』問題,不是問一些空泛的問題,而是要問得精準。」

他解釋,為令AI回答時更「對症下藥」,學生需要向AI提出精準問題,其思維能力「唔會弱得去邊,一定是『醒目』的學生」,但如果學生只倚賴AI而懶得去思考、尋找答案,「如此會浪費了磨練和發揮其學習潛質的機會,十分可惜。」

考評局:AI作品當自創屬違規

DSE筆試時不可使用ChatGPT,對考試影響不大,但鄧飛表示,現時DSE的校本評核,例如中文科的閱讀報告,形式與「濃縮版」的大學論文相似,同樣會面對因ChatGPT而生的作弊風險與衝擊。考評局在回覆香港文匯報查詢時強調,如考生把以AI工具構成的作品及由他人完成的習作,無論是部分或全部,將之當作自己的作品向教師遞交,屬違規行為。學生在完成課業過程中,可參考不同類別的資料,但不可觸犯抄襲行為,並須在作業中註明所引用資料的來源並加以鳴謝。

指教師能核證學生作品

在今年DSE精簡安排下,本屆維持校本評核的科目由原有14科減至4科,即中文、英文、設計與應用科技及視覺藝術,分別佔總分10%、15%、20%及50%。考評局提醒,在完成校本評核活動的過程中,學生須謹記不可觸犯任何違規行為,而任教老師應密切留意學生的進度,以核證所評核的習作是學生本人的作品。

考評局解釋,教師是最了解學生能力的人,只要透過適當監察,應能發現違規行為,而根據該局提供有關各科校本評核的評核指引,老師可參考不同措施以防止作弊情況,包括評核活動應大部分在學校環境進行,把校本評核融入日常學與教過程中,而非設計成課程的外加部分,以及把校本評核活動納入校內日常評估措施的一部分。