Generative AI for Everyone

推 Andrew Ng 在 Coursera 的線上課程: Generative AI for Everyone

Generative AI 是極重要的新科技,善用這個工具,可以對人類帶來極大的幫助,這堂課的對象是每個人 (不需要任何 programming background,裡面的 optional video 帶學習者 trace/run 短短幾行 code,就可以完成一個簡單的 generative AI project),綜述了 Generative AI (這堂課專注在探討大型語言模型) 的幾個重要層面:

• Generative AI 的運作原理
    • Generative AI 能做什麼、不能做什麼
        • 判斷 LLM 能做什麼的方法: 假設你把相同的問題丟給大學畢業生,他是否能夠回答 (condition: 他不能 access Internet 或書籍, 他對於提問沒有相關的背景知識, 要假設你每次都是從不同的大學畢業生得到答案)
        • LLM 的限制: knowledge cut-off (在 model training 好的那個時間點之後的事情, model 都不會知道); 幻覺 (LLM 會輸出實際上不正確的事情,而看起來很像是正確的); input/output 長度是有限制的; 可能會學到 bias 或 toxic 資訊
    • 常見的用法:
        • 寫作 (例如:brainstorm product names、write a press release、developing sales strategy...)
        • 閱讀(例如:校正一段文字、總結一場會議的對話、閱讀評論判斷是正評或負評、閱讀來自顧客的e-mail判斷要交給哪個部門處理、讓 AI 閱讀後,問 AI 相關的問題,可根據問題的回答幫助人類或餵進軟體做 workflow automation...)
        • 聊天 (例如:可建構客服系統...)
        • 作為推理引擎(例如:提供資訊給 LLM, 問問題讓 LLM 回答,並說明推論的過程)

• 如何建構 Generative AI 專案
    • Generative AI 專案包含哪些要素
        • 界定專案目標 → build/improve system → 內部評估 → deploy and monitor
        • 做一個 supervised learning 專案一般至少需要半年,做一個generative AI 專案一般只需要幾分鐘到幾個小時 (指 build system 的部分)
    • 相關的技術:
        • prompting
        • RAG (Retrieval-Augmented Generation): 讓 LLM access 指定 data source,因此能夠擁有精準的資訊,並從中提煉出 insight
        • fine-tuning: 能夠讓 LLM 學會某種談話風格,或者學習特定的專業語言,例如診斷紀錄裡的醫學名詞縮寫、財務語言、法律用語;能夠把大模型縮成小模型,以便在 edge 運算或加快反應速度           
    • Model Size: 1B 參數: 對世界有基本的理解; 10B 參數: 對世界有相當的理解, 可以執行基本的指令; 100B 參數: 對世界有豐富的理解, 可以做複雜的推理.

• Generative AI 在商業及社會層面的考量
    • 商業層面: 把 job 拆解成 tasks,分析是否值得、能夠導入 GAI,若是,分析 task 適合做 automation 還是 augmentation (AI 輔助人類)
    • 社會層面: 解釋常見的 concern,responsible AI (AI 要達到公平、決策透明、保護隱私、防患駭客攻擊、符合道德)

課程連結:
https://www.coursera.org/learn/generative-ai-for-everyone/

資訊來源: DeepLearning.AI