在前兩篇文章中,我先整理了這個 AI Education Platform 如何從模糊收斂成 G6–G12 AI 學習平台,也拆解了學生端如何從「問 AI 一次答案」,逐步延伸成能累積能力、生成練習、追蹤 skill 與規劃學習路徑的 AI Learning System。
這一篇,我想把視角轉到老師端。
因為在 AI 教育產品裡,老師端真正難的地方不是「AI 能不能幫老師出題或批改」。技術上,AI 可以生成題目、改寫文章、產生評語、初步判斷答案,甚至整理學生表現。
但產品上更重要的問題是:
AI 要幫老師做到哪裡?
哪些判斷必須保留給老師?
老師如何信任 AI 的結果?
AI 產生的內容,如何真正進入教學流程,而不是變成另一個需要老師檢查的負擔?
所以我在設計老師端時,沒有把 AI 定位成「取代老師」的角色,而是把它定位成一個可以協助老師減少重複工作、整理資訊、提供初步判斷,但最後仍由老師掌握控制權的教學助理。
換句話說,老師端的核心不是全自動,而是:
可控、可審核、可調整
老師端要解的問題:讓老師工作流變輕鬆
在 After School 場景中,老師的工作不只是上課。
他們需要準備教材、設計作業、生成練習、批改答案、追蹤學生進度,也要判斷哪些學生需要額外協助。這些工作很多都重複、耗時,而且很難做到個人化。
尤其當一個班裡的學生程度不同時,同一份作業可能對某些學生太簡單,對某些學生太難。老師想要更精準地幫不同學生安排練習,但現實上通常沒有足夠時間為每個學生準備不同版本。
所以老師端的設計目標,不是讓老師覺得「這裡有 AI,很酷」,而是讓老師在真實工作流裡感覺:
備課快一點、出題輕鬆一點、批改少一點、追蹤清楚一點,但最後判斷還是在我手上。
如果 AI 讓老師失去控制權,老師不會信任它。
如果 AI 只是多產生一堆內容,老師還要花更多時間檢查,那它也沒有真的減負。
老師端真正要做的,是讓 AI 進入老師原本的工作流,而不是另外製造一條新的工作流。
老師端從課堂與學生管理開始
一開始設計老師端時,我沒有像許多產品一樣直接把重點放在「Generate with AI」按鈕上。因為在教育場景裡,AI 生成內容之前,老師一定需要先有教學脈絡,例如:
- 這份作業屬於哪個 class?
- 對應哪個 grade?
- 是 English / Language Arts 還是 Math?
- 要練哪個 skill?
- 是派給整班,還是特定學生?
- 是日常練習,還是正式作業?
- AI 生成後老師能不能修改?
- 學生提交後,AI 的評分要不要先經過老師審核?
這些都會影響產品流程。
所以老師端不是幾個 AI 工具拼在後台,而是一條完整的 AI-assisted teaching workflow。
我把老師端的核心流程整理成:
課堂管理 → 學生管理 → 作業建立 → AI 生成 / 編輯 → 發布 → 學生作答 → AI 初評 → 老師審核 → 發還 → 學習追蹤
這條流程決定了老師端不是單純功能集合,而是要承接教學現場的順序。
如果沒有 class 和 student 的脈絡,AI 出題就不知道要對誰出。
如果沒有 grade 和 skill 的脈絡,AI 生成的題目就不一定符合學生當前階段。
如果沒有 review 和 release 的流程,AI 批改就可能直接影響學生學習結果,風險太高。
老師端看似是後台,其實是整個平台的教學控制中心。
AI 生成作業:不是隨 AI 自主生,而是在老師設定的教學框架內生成
老師端中,AI Assignment Creation 是很核心的功能。
市面上多數 AI 教育平台多是「老師貼一段文章,AI 自己生一份作業」。那樣看起來很省事,但實際上風險很高。AI 可能生成不符合年級的題目,也可能沒有對齊老師想訓練的 Skill;題目可能格式完整,但教學目的不清楚。
所以我希望 AI 生成前,老師要先提供足夠的教學框架。
例如老師可以指定科目、年級、題型、題數、難度、作業目標、對應 Skill 或 learning standards,也可以提供評分標準或教材內容。這些設定讓 AI 能在正確範圍內生成。
以 English / Language Arts 為例,同樣一篇文章,老師可能有不同教學目的。
- 如果目標是 Literary Analysis,AI 可以生成主旨、細節、作者觀點相關題目。
- 如果目標是 Formal Writing Style,AI 生成的題目就應該更偏語氣、句型、正式表達與改寫等。
- 如果目標是 Argument Structure,AI 就應該引導學生辨識論點、證據、推理,而不是只問文章表面內容。
這是我在老師端很重視的地方:
AI 不是只要能生成題目,而是要知道這份作業到底在練什麼。
能力導向出題:老師端也是學生能力數據的上游
學生端文章中我提到,第二版開始 AI 不只是回答學生帶來的題目,也能根據學生目標、年級、科目、learning standards / skills 主動生成練習。
而老師端的設計,正好是這套能力導向出題邏輯的另一半。
老師在建立作業時,需要能清楚設定這份作業對應的年級、科目與 Skill。因為如果題目沒有被結構化到 Skill 層級,後續就很難累積學生能力數據。
例如 English / Language Arts 不能只籠統地記成「英文作業」,而是要知道它在訓練 Literary Analysis、Formal Writing Style、Text Analysis、Argument Structure,還是 Domain-Specific Vocabulary。
這件事有三個價值:
第一,老師更清楚這份作業的教學目的。不是「今天做英文練習」,而是「今天練 Text Analysis」。
第二,AI 生成題目時更有方向。它不是亂出一題英文題,而是針對特定能力生成題目。
第三,學生端的能力地圖才累積得起來。如果每一題或每一份作業都能對應到 skill,後續 My Skill Profile 才能判斷學生哪些能力已掌握、哪些還需要補強、是否能進入下一個 level。
所以老師端不是只負責派作業。它也是學生端能力追蹤的上游資料來源。
AI 生成後不是 final:老師需要可編輯、可預覽、可控的發布流程
AI 生成作業後,我沒有把它設計成直接發布。因為教育內容需要老師把關,即使 AI 生成的內容看起來完整,老師仍可能需要調整題目語氣、替換選項、增加提示、降低難度、補充說明,或改變題目順序。
所以這裡的產品設計重點是:
AI 的輸出應該是 draft,而不是 final。
老師可以檢查、修改、接受或拒絕 AI 建議;如果 AI 改寫文章,也不應該直接覆蓋原文,而是讓老師知道改了哪裡,並決定是否採用。這不是保守,而是信任設計。當老師知道自己可以控制 AI 生成結果,才比較可能放心使用 AI。
同時,老師發布前也需要能預覽學生端畫面。因為老師在編輯畫面中可能看到文章、題目、答案、評分、AI 建議與批改設定,但學生端應該只看到需要作答的內容,不能看到答案、教師用備註或評分邏輯。
因此,Preview Student View 的價值不是多一個預覽按鈕,而是讓老師確認:學生看到的內容是否清楚、題目順序是否合理、作答區是否容易理解,以及有沒有不該顯示給學生的資訊。
對老師端來說,AI 生成流程不能只追求速度,也要設計出可控性。老師真正關心的不是「AI 生成了什麼」,而是「這份內容發布出去後,學生是否能正確理解並完成」。
這也是老師端和學生端必須被一起設計的原因:
老師端每一個設定,最後都會變成學生端的一段學習體驗。
作業狀態:老師端不是表單送出,而是流程管理
老師端還有一件很容易被低估的事:狀態管理。
老師端的作業不是「建立表單 → 送出」就結束,因為每個狀態都會影響學生是否看得到作業、能否作答、能否修改,以及老師是否能批改與發還成績。
作業執行流程可以整理為:
Draft 草稿 → Published 已發布 → Submitted 學生已提交 → AI Grading AI 初評 → Teacher Review 老師審核 → Released 發還學生
Draft 階段,老師可以自由修改;Published 後,學生端已可看到作業並開始作答,題目就不能隨便改;Submitted 後,學生答案應被鎖定,避免提交後又修改;AI Grading 後,結果不能直接發還,必須經過老師審核;Released 後,學生才看到最終成績與回饋。
另外,Assignment History / 作業出題紀錄是老師端保存過去建立、發布或使用過的作業與題目,方便老師回頭查看、複製、重新編輯或再次派發。
對老師端來說,狀態管理不是多餘流程,而是避免老師端與學生端資料不一致,也是建立信任感的一部分。
AI 初評:先減少重複工作,但不直接決定學生結果
學生提交作業後,AI 可以先進行初步評分。
這件事很有價值,因為老師最耗時的工作之一,就是大量重複批改。尤其是選擇題、是非題、部分填空題或計算題,AI 或系統都可以協助快速判斷。
但 AI 初評不是終點。因為教育裡的答案不總是只有對錯,簡答題、寫作題、閱讀理解題、圖解題或複雜分析題,常常需要理解學生的表達、推理過程、創意與上下文。有些答案可能不是標準答案,但仍有部分合理;有些學生的表達不成熟,但其實概念方向是對的。如果 AI 直接評分並發還給學生,風險太高。
所以老師端的邏輯是:
AI 先初評、先整理、先標記問題;老師最後審核、調整、發還。
AI 可以幫老師先完成重複性工作,例如判斷明確題型、整理學生錯誤、產生初步評語、標記需要注意的答案。老師則保留最後判斷權,例如調整分數、修改評語、決定是否發還,或判斷學生是否需要額外介入。AI 可以提高效率,但不能直接拿走老師的教學責任。這是我們認為老師端的 AI 很重要的邊界。
Human-in-the-loop:不是保守,而是教育 AI 的信任設計
在這個案子裡,我一直認為 Human-in-the-loop 不是一個漂亮名詞,而是教育 AI 產品裡必要的設計。
原因有三個。
第一,不同題型的自動化可行性不同。
選擇題、是非題、部分填空題、計算題比較適合自動判斷;但開放式題型、寫作、分析題,就需要老師審核。
第二,AI 可以從長期數據中看見模式,但老師仍需要保留情境判斷與介入權。
隨著學生學習數據累積越多,AI 確實可能比老師更快發現某些趨勢,例如學生反覆卡在哪個 Skill、哪類題型錯誤率偏高、最近是否退步,或某個能力是否已經達到穩定狀態。
但教育判斷不只來自數據。同一個答案,在不同學生身上可能代表不同問題。有些學生可能是第一次嘗試,所以老師更看重進步;有些學生平常能力不錯,這次答錯可能是粗心、情緒狀態或當天表現不佳;有些學生反覆在同一類題型出錯,AI 可以先標記風險,但是否需要補強、鼓勵、調整任務,或進一步人工介入,仍需要老師做最後判斷。
老師端的重點不是假設「老師一定比 AI 更懂學生」,而是讓 AI 先用數據幫老師看見問題,再讓老師根據教學情境、學生狀態與責任判斷,決定下一步怎麼介入。
第三,老師需要信任平台。
如果 AI 直接批改、直接發還、直接決定學生成績,老師會覺得自己被排除在教學流程之外。但如果 AI 是先幫老師整理資訊,老師再做最後確認,平台就比較像助教。
所以 Human-in-the-loop 不是降低 AI 的價值,而是讓 AI 真正有機會進入教學場景。因為老師願意用,AI 才有機會真的幫上忙。
Multi-agent:提高生成與評量可靠性
第二版開始,我們也開始納入 multi-agent 的思路。但這裡不是指一開始就做很多個 AI agent,而是先把 AI 生成 和 AI 驗證 拆開來。
在教育產品裡,AI 生成內容的風險比許多內容工具更高。因為題目、答案、難度與評分結果,都會直接影響學生的學習與判斷。如果 AI 生成了一題看似合理、但答案不精準的題目,老師可能要花更多時間檢查;如果 AI 批改錯誤,學生可能會收到錯誤回饋。
所以 Multi-agent 的必要性在於:AI 不能只負責產出,也需要有另一層檢查與修正機制。例如,AI 先協助生成題目、答案或初步回饋;接著再透過另一個 AI / 規則檢查生成內容是否合理,例如題目是否對齊年級與 Skill、答案是否有明顯錯誤、難度是否過高或過低、評分標準是否被正確套用。
這樣做有幾個優勢:
- 第一,它能降低 AI 生成內容「看起來合理但其實不準」的風險。
- 第二,它能把題目生成、答案檢查、難度判斷與回饋品質拆成不同任務,讓每一層更容易測試與優化。
- 第三,它能讓老師不用從零開始檢查所有內容,而是先看到被初步驗證過、或被標記出風險的結果。
- 第四,它也能支援後續 prompt 與規則優化,因為我們可以知道問題出在生成階段、檢查階段,還是難度判斷階段。
Multi-agent 的價值不是讓系統變複雜,而是讓 AI 教育產品從「能生成」往「可驗證、可調整、可被老師信任」前進。
不過,這類能力需要更多教材資料、驗證規則、測試案例與實際使用結果,不適合在第一版就做成完整成熟的功能。因此產品節奏上,把它定位成第二版開始納入、後續持續 fine tune。
雙端平台:老師與學生如何串成完整閉環
老師端和學生端不是兩套獨立系統。它們需要彼此串接,才能形成完整的學習閉環。
老師端建立課堂、設定 Skill、生成作業、派發任務。
學生端接收作業、完成作答、查看回饋。
AI 先批改、整理錯誤、標記需要注意的答案。
老師端審核、調整、發還。
學生端收到結果後,平台更新學習歷程與能力狀態。
後續 My Skill Profile、AI 生成練習、Study Plan,都可以根據這些數據調整。
這條流程可以整理成:
老師設定學習任務 → AI 協助生成 → 學生完成 → AI 初評 → 老師審核 → 回饋學生 → 更新能力狀態 → 生成下一步練習
這也是為什麼老師端設計不能只看老師畫面。因為每一個老師端設定,都會影響學生端看到什麼、學到什麼、被如何評價,以及後續 AI 如何推薦練習。
雙端平台真正難的地方,不是兩邊都有功能,而是兩邊的數據、狀態與責任要接得起來。
不是只做產品,而是在參與教學的過程
這個案子對我來說很有趣,因為它不是單純把 AI 放進一個產品裡,而是要思考 AI 怎麼進入學生學習與老師教學的真實流程。
雖然這個案子最後在第三階段開發完成前夕暫停,對我來說有點可惜,因為它已經從學生自學、老師端作業流程,逐步走到個人化學習計劃與能力追蹤的雛形。
也正因為它是教育產品,我在設計產品的過程中其實一直很謹慎。
產品怎麼引導學生、怎麼給回饋、怎麼判斷對錯、什麼時候讓 AI 介入、什麼時候讓老師審核,都不只是使用體驗問題,而可能影響學生怎麼理解自己的能力、怎麼看待錯誤,以及下一步怎麼學。
因為我很清楚意識到,當我在開發一個教育產品時,某種程度上也代表我正在參與教育。