鉅亨網新聞中心
日本 AI 新創 LifePrompt 於 4 月 27 日公布一項引發關注的測試結果,顯示 ChatGPT 在模擬作答 2026 年東京大學與京都大學入學考試時,總分全面超越人類考生最高分,甚至在最難的理科考試中領先約 50 分,凸顯生成式 AI 能力正以驚人速度進化,對教育制度與人才評量帶來衝擊。
此次測試採用 OpenAI 最新模型「ChatGPT-5.2 Thinking」,以影像形式輸入試題,並涵蓋論述題等複雜題型,最終由補教機構講師人工評分,並結合大學入學共通測驗成績計算總分,使結果更貼近真實考試情境。
根據公布數據,AI 在兩校主要科系中均取得壓倒性優勢,整體成績如下:
| 項目 | ChatGPT 成績 | 人類最高分 | 差距 |
|---|---|---|---|
| 東大文科一至三類 | 452 分 | 434 分 | +18 分 |
| 東大理科一至三類 | 503 分 | 453 分 | +50 分 |
| 京大法學系 | 771 分 | 734 分 | +37 分 |
| 京大醫學系醫學科 | 1176 分 | 1098 分 | +78 分 |
從細項來看,AI 在標準化與邏輯導向科目表現突出,但在論述題仍有明顯差距:
| 科目類型 | 表現 |
|---|---|
| 數學 | 滿分 |
| 英語 | 約 9 成 |
| 世界史(論述) | 約 2 成 5 |
參與評分的講師指出,AI 在解題邏輯上「相當完整」,但部分論述仍欠缺人類觀點的細膩性與深度。
值得注意的是,這項成果建立在極短時間的技術躍進之上。LifePrompt 指出,2024 年使用當時模型測試時,ChatGPT 在東大考試中「全科未及格」;2025 年採用新一代模型後首次達到及格水準;2026 年則直接躍居第一名。
| 年份 | 模型表現 |
|---|---|
| 2024 年 | 全科未及格 |
| 2025 年 | 首次超過及格線 |
| 2026 年 | 全面第一名 |
對此,LifePrompt 負責人遠藤聰志表示:「AI 的聰穎得到了充分展現,其進化速度飛快。」他並指出:「企業在導入 AI 時,應著眼於 10 年、20 年後的業務形態。」
此次測試結果也與全球 AI 發展趨勢相呼應。隨著大型語言模型持續升級,AI 已從過去的輔助工具,逐步轉向可執行高階認知任務的系統,甚至在標準化考試中超越人類頂尖群體。分析人士認為,這不僅對教育制度構成挑戰,也可能改變未來人才評量方式。
教育界普遍認為,傳統以解題能力為核心的考試模式正面臨壓力,未來可能需更強調創造力、批判思考與跨領域整合能力。同時,人機協作能力也可能成為新的關鍵指標。
隨著 AI 能力持續突破,類似情況預料將不僅限於考試場域,醫療、法律與金融分析等專業領域亦可能出現 AI 與人類直接競爭的局面。觀察指出,這次 ChatGPT 在東大與京大考試中的表現,可能只是 AI 全面進入高知識密集領域的開端。
上一篇
下一篇
