ChatGPT挑機文憑試考中史獲5級佳績

◆各項AI工具的答案將愈來愈精準，將會對中學教育及考核帶來極大衝擊。圖為去年文憑試的一個試場。資料圖片

◆鄧飛直言，生成式AI工具對中學教育與學生的學習行為和質量都一定會帶來衝擊。香港文匯報記者萬靈霜攝

文匯報實測不足一分鐘答完教育界憂影響校本評核結果

人工智能（AI）工具ChatGPT自推出以來引起廣泛討論，在教育界更引發激烈爭議，海外及本港先後有大學禁止學生於課業中使用AI工具，同時亦有大學持較開放及積極的態度。事實上，除了大學外，生成式人工智能工具對基礎教育以至公開試發展也同樣帶來挑戰。

一年一度的中學文憑試（DSE）在今日（21日）開考。香港文匯報針對主要以文字答題的通識科和中史科考試，日前讓ChatGPT作答2022年兩份考卷的選答題，並分別邀得本港資深教育界人士為答案評分。結果顯示，ChatGPT在不足一分鐘時間內，通識科能取得足夠升讀大學的3級成績，而中史科考試更獲評5級佳績。教育界人士表示，雖然公開試的試場監考形式暫不會受ChatGPT影響，但AI工具能輕易取得不遜於一般學生水平的成績，可能會影響校本評核的結果。同時，隨着各項AI工具的「進化」，答案將愈來愈精準，將會對中學教育及考核帶來極大衝擊。 ◆香港文匯報記者金文博

未掌握通識卷應試要求

香港文匯報日前選取了2022年DSE通識科卷二延伸回應題第一題予ChatGPT回答。該題目提供了三項關於虛擬祭祀、電子紅包及環保中秋的資料，要求考生根據資料1）回答並解釋網上祭祀有哪些好處，及 2）表態並論證在多大程度上同意，在現代社會實踐中國傳統習俗時應優先考慮環保。

在首部分中，ChatGPT的答案驟眼看頭頭是道。它提出了網上祭祀可減少環境污染風險，同時方便遠離香港的家人和朋友參與紀念，表達對先人的思念和禮敬，同時促進家族間的聯繫和交流。在第二部分，ChatGPT表明同意環保因素應優先考慮，及列出三個支持理由，包括「保護環境是我們的責任」、「現代科技提供了一些環保的替代方案」及「環保是對下一代的責任」，並嘗試逐一說明。（問答全文請掃碼）

香港文匯報邀請資深通識科老師、立法會議員鄧飛為答案評分。他表示，在共佔8分的首部分中，有關答案可得到6分相等於4級的成績，但ChatGPT所提供的答案未有理會題目提供的資料，只用「常識」作答。

缺正反兩面論述

佔12分的第二部分，評分則為僅僅合格（2級），兩部分合計大約可得3級。鄧飛解釋，題目中的「多大程度上認同」除了要求明確回答認同與否的程度，還要求考生從正反兩面論述對比，不應只說出一方面的觀點。在ChatGPT答案中，只說出支持優先考慮環保的理由，卻沒有從反面說出質疑的理由，並不符合考試要求，所以只能僅僅合格。

他表示，從答案分析，ChatGPT最大的問題在於未能掌握應試及題型要求重點，因為有些答題技巧未必是從試卷題目中字面顯示，而是通過日常教學及考評局與前線老師溝通等所得。

鄧飛表示，根據目前的資料顯示，ChatGPT及其他AI工具尚不知道考試要求，即使以它來作弊，可能只得到合格的分數，對學生考試「出貓」誘因看似有限，然而不能排除若將來各項AI工具能進一步「掌握」考試的答題要求，只要輸入仔細的問題指令後，就可能提高答案準確度。 ◆香港文匯報記者葉子之

中史答卷全面援引稍不足

香港文匯報日前向ChatGPT發問了2022年文憑試中史科試題卷二單元三「時代與知識分子」的第七題。題目提供了兩份資料，包括孔子輔佐魯定公和齊景公會盟的「夾谷之會」，以及孔子處理魯國中三家擁「百雉之城」貴族的「墮三都」事件，要求考生論析孔子1）對魯國外交和內政的貢獻，和 2）如何從周遊列國、講學授徒和整體典籍三方面實踐政治理想。

ChatGPT在答題時，依照了問題所指的外交和內政，及周遊列國、講學授徒和整體典籍三方面點列說明。其間，記者曾指示ChatGPT「tell me more」，它在短短一分鐘內一舉回答了2,000字內容（問答全文請掃碼）。

香港文匯報記者邀請到教聯會副主席、中史科教師穆家駿為有關答案評分，單以該題而言，ChatGPT獲評DSE 5級水平，表現較通識卷為優。

就問題第一部分而言，穆家駿表示，ChatGPT能引用資料中有關「夾谷之會」的文字和史實，分析孔子的外交貢獻，惟在內政方面單純參照資料，沒有引用史實解釋「百雉之城」的意思和意義，以及孔子如何對付季孫氏、叔孫氏和孟孫氏這三個僭越自擁「百雉之城」的魯國卿大夫，因此只能獲得10分中的7分。

善用AI輔助而非倚賴

在第二部分，穆家駿表示，ChatGPT大致能夠從周遊列國、講學授徒和整理典籍三方面回答題目要求，只是在史實援引方面稍有不足，例如並沒有提出一些著名例子，來析論孔子如何透過講學授徒來實踐政治理想，包括其門下出了子路、子貢等後來都投身政治的學生等，「其餘整體的表現都不錯」，因此可獲15分中的13分。

就ChatGPT等生成式AI對於中學教育帶來的衝擊和影響，穆家駿認為，很多情況下若學生只是利用AI工具作「頭腦風暴」（brainstorming）之用，教師與學校確難以分辨，因此重要的是教育學生怎樣善用AI輔助自己學習，而非完全倚賴AI作答，自己卻完全不用腦去思考。

鄧飛：對文科或有利理科恐冇着數

ChatGPT等生成式AI工具的誕生和不斷發展，鄧飛直言，它們對中學教育與學生的學習行為和質量都一定會帶來衝擊，尤其是對語文科、人文社會學科及商科等影響更大。由於學校不可能要求學生留校在老師的監督下完成所有功課，因此當他們在家做功課時，就有機會利用AI工具「精準地、聰明地作弊（smart cheating）」，例如將AI工具給予的答案進行撮寫，或是花費心力對它問出精準、仔細的問題，以獲得滿意和符合功課要求的答案。

鄧飛表示，對理科知識和運算思維，如果學生平時透過生成式AI工具直接把題目輸入，很快就可以獲得答案，「但是當到了考試、測驗時就一定會『現形』，不懂得作答。」然而，如果學生於語言及社會人文科目利用AI工具，卻不一定會有「現形」的情況，因為他們平日在「精準地、聰明地作弊」的時候，可能不知不覺中磨練出相當程度的語言和社會人文素養，這樣他們的考試表現或比平日稍為遜色，卻未至於會「現形」、「交白卷」。

可能破壞師生間信任

在談到ChatGPT等生成式AI工具對學校帶來的衝擊，鄧飛指出，其中一個重大挑戰在於，中小學較難像大學般設置專門軟件程式去檢視、偵察學生的功課是否具有抄襲、作弊或經過AI生成的成分，因此要迫不得已做最壞假設，可能會將功課改成頻繁堂課和測驗，以確保學生有真正去學習而非倚賴AI。這樣做的代價就是，一方面會擾亂學校的教學秩序，「什麼時候家課、堂課、小測、大測和大考的規律會被打破，而頻繁地測驗也會增加學生的應考壓力，對心理健康可能造成負面影響。」另一方面，也會引致師生間互相防備，破壞彼此間的信任。

鄧飛認為，ChatGPT亦可帶出「智者問得巧，愚者問得笨」效果，對教學有相應好處，「學習的關鍵就是要懂得『問』問題，不是問一些空泛的問題，而是要問得精準。」

他解釋，為令AI回答時更「對症下藥」，學生需要向AI提出精準問題，其思維能力「唔會弱得去邊，一定是『醒目』的學生」，但如果學生只倚賴AI而懶得去思考、尋找答案，「如此會浪費了磨練和發揮其學習潛質的機會，十分可惜。」

考評局：AI作品當自創屬違規

DSE筆試時不可使用ChatGPT，對考試影響不大，但鄧飛表示，現時DSE的校本評核，例如中文科的閱讀報告，形式與「濃縮版」的大學論文相似，同樣會面對因ChatGPT而生的作弊風險與衝擊。考評局在回覆香港文匯報查詢時強調，如考生把以AI工具構成的作品及由他人完成的習作，無論是部分或全部，將之當作自己的作品向教師遞交，屬違規行為。學生在完成課業過程中，可參考不同類別的資料，但不可觸犯抄襲行為，並須在作業中註明所引用資料的來源並加以鳴謝。

指教師能核證學生作品

在今年DSE精簡安排下，本屆維持校本評核的科目由原有14科減至4科，即中文、英文、設計與應用科技及視覺藝術，分別佔總分10%、15%、20%及50%。考評局提醒，在完成校本評核活動的過程中，學生須謹記不可觸犯任何違規行為，而任教老師應密切留意學生的進度，以核證所評核的習作是學生本人的作品。

考評局解釋，教師是最了解學生能力的人，只要透過適當監察，應能發現違規行為，而根據該局提供有關各科校本評核的評核指引，老師可參考不同措施以防止作弊情況，包括評核活動應大部分在學校環境進行，把校本評核融入日常學與教過程中，而非設計成課程的外加部分，以及把校本評核活動納入校內日常評估措施的一部分。

讀文匯報PDF版面