EP24 - OpenAI 發布 Strawberry (o1)

AI 進入推理的領域 | AI 寫作可行嗎?

歡迎來到降噪,一起消除雜訊洞察價值

OVERVIEW
本期重點

  • OpenAI 發布 Strawberry (o1)

  • AI 寫作可行嗎?

HOTNEWS
OpenAI 發布 Strawberry (o1)

OpenAI 發佈 Chat-GPT o1 preview 與 o1 mini 模型

Strawberry (o1) 讓大型語言模型進入推理領域

2024/09/12 千呼萬喚的草莓模型終於釋出,花了一點時間消化官方與國內外的訊息,有幾個重點分享​

o1 Preview 與 o1 Mini

​先介紹這次發布的模型:

這次發布了兩個模型,分別是o1 preview 與 mini 兩個模型各自有擅長的能力。Preview 模型能作開放式問題的推理

像是

我在杯子裡放一個草莓
把杯子倒過來放在桌上
再把杯子放到微波爐裡
請問草莓在哪?

而 mini 模型則擅長 coding 與數學計算

Mini 在數學與程式方面更有優勢

有訂閱 Plus 的用戶可以立即使用,每週限制 Preview 30 次詢問 Mini 50 次詢問

o1-mini 已開放給免費用戶

​你可能會問,為什麼要限制次數?因為這次的技術進步在計算上十分昂貴

Strawberry (o1) 的技術重點

有別於先前的模型,o1 在每次的詢問都會需要數秒~數十秒的思考時間

外界猜測,OpenAI 似乎建立了一個推理模型,這個模型會將使用者的問題拆分成不同的步驟,而後執行一連串的交叉、循環的答辯,並由一個評分機制來管理輸出。這其中涉及了記憶、工具訪問、評分、獎勵機制、成本計算...等複雜的架構。

​大家可以想像這些不同的機制就像各自獨立的 Agent,每個 Agent 會接收上一個 Agent 傳遞下來的訊息作下一步工作。如果這個層數是十層可能還好,但如果是百層千層最終傳遞的 Token 數量將會十分驚人。

​這也是為什麼這次的模型要限制用戶的使用次數
( 以上機制是猜測,OpenAI 官方並沒有分享這些內容 )

LLM 學會推理後會怎樣

這次的模型對一般使用者應該會相當無感,除非學術研究,不然大家不會沒事問複雜的數學問題,但對 LLM 的進化卻是巨大的。

​在機器學習領域有個不敗的方程式,就是當 AI 有能力自己跟自己切磋後,後面就會迎來指數級別的增長,如同 Deepmind 的 AlphaGo 透過自我對弈進入無人知曉的領域。

​這次的 o1 模型有點那個味道

​若是這個推理機制有效,OpenAI 將可透過這個流程自我創造無限的 synthetic data ( 合成數據 )。再將這些超高品質且驗證 ( 邏輯推理過的 ) 數據訓練更精煉的模型。如同 4o mini 是 4o 生成的合成數據訓練的。

Tesla 的 FSD 也在建立自己的 AI 智慧飛輪

接下來 OpenAI 將有能力泛化各個領域的知識

結論

先前也有使用 Make 工作流來實現不同 Agent 相互監督的機制,甚至可以用 Claude 來評分 GPT 是不是做好它的工作。

但大概串到五六層就發現驗證成本極高,因為每個 Agent 都需要有一個評分機制來確認是否合用,最好是他們還有自我更新的能力,能自己改寫自己的 Prompt。

我感覺 Strawberry (o1) 似乎解決了上述的問題,會根據問題的大小來按需組織一個上百或上千個 Agents 處理問題,而這些 Agnets 也有能力來自我提升。

問題又回到 Scaling Law,老黃又笑了。

SHARING
AI 寫作可行嗎?

5 個使用 AI 寫作的心得

​上上週是降噪電子報 EP-22 的發布時間,除了感謝大家的訂閱,第 22 期有些其他的心得與大家分享。

特別挑選這期是因為這期的三篇文章 95% 都是使用 AI 工作流生成的,我只稍微調整了修辭與排版。看起來很像釣魚的標題也是狠著心直接使用 AI 生成的,因為我很好奇 AI 與我寫的誰的效果更好?

當初開始寫電子報除了把它當成臉書文章的備份,另一邊我也同時在實驗如何使用 AI 工作流來撰寫文章。

心理門檻​

剛開始研究 AI 寫作時,心裡總是有種偷懶的感覺,好像複製貼上就可以生成一大堆的內容。直到深入研究,接觸到國外的學習資源後,才發現 AI 寫作已是一門專業的技能。

矽谷的新創團隊都在組建自動化內容團隊,目的就是要利用 AI 自動化的力量驅動更多的曝光,特別是在 Growth Hack - 成長駭客領域。

更正,不是團隊通常都是一個人。

Perplexity 有個官方的 Podcast 節目,完全由 AI 生成,而且僅由他們的品牌設計師一人打造。

等等...現在 AI 不是會有嚴重的幻想嗎?怎麼會有品牌敢把自己的聲譽賭在 AI 上?還是他們有什麼特別的方法,可以產出高品質的內容?

提升領域的 Sense​

我原先以為讓 AI 生成文章只是滑鼠點一點的事,深入研究後才發現要讓 AI 寫出好文章這是一個巨大的坑。不只要理解生成式 AI 的各種特性,還要分析好的內容究竟該怎麼撰寫。

​為此還把幾年前在 Domestika 買了都沒上的線上課程補完。

​【 The Art of Storytelling 】by Sun Yi​
超推,讓你有基本的寫作邏輯。而且只要 29 台幣(賣很多年的長青課程所以便宜)
【Copywriting for Social Media】by Paul Anglin
比較偏向社群文案的課程,會比較偏海外的面向,可以學一下心法。

上完這兩堂課,才認知到。文字是可以被結構化且巧妙設計的

為什麼有些文章很長但一下子就讀完,而有些文章很短卻一點想讀的意願都沒有。只有自己的認知提升到一個水準之後,才有能力判斷好的內容與差的內容。

如同有經驗的工程師不需要擔心被 AI 取代,因為他們有深厚的經驗判斷生成出來程式碼的好壞,這就是基本的領域 Sense。

有了領域的基本 Sense 接下來就可以試著與 AI 合作

實驗、測試​

一開始與 AI 的協同度大約 30%,很多時候都必須再花費大量的時間做修改。這狀況持續一陣子,期間不斷的去分析別人的文章為什麼好,慢慢的開始對社群寫作有初步的理解。

第一個感受到的差別就是能用的 Prompt 變多了,沒學過電影寫作的可能沒聽過'三幕劇結構',不懂行銷的可能不了解'AIDA'是什麼意思

三幕劇結構是一種常見的故事叙述方式,簡單來說,包括三個主要部分:開始、衝突、結局。這種結構適用於各種故事形式。根據席德菲爾德(Syd Field)的電影三幕理論,這三個部分分別對應鋪陳、發展和結尾等階段。開始階段主要是建立故事背景和角色,發展階段則是引發主要衝突,結尾階段則是解決衝突並帶來故事结局。

三幕劇結構

AIDA是一個行銷模型,包含四個階段:注意(Attention)、興趣(Interest)、渴望(Desire)和行動(Action)。這個模型主要描述了消費者在購買過程中如何從吸引注意到最終進行購買的過程。用於設計行銷策略和促銷活動時,它幫助企業理解消費者的心理變化。

AIDA

這些獨特的 Prompt 索引著大型語言模型裡的超能力,有時候一個字就映射了某個產業知識的歷史切片。

但如同料理的調味劑,沒有加就少一味,加多了反而難吃。如何感知與平衡這些細微的差異就顯得格外重要,把關者的 Sense 會決定最終成果的好壞。

體感上, Prompt 決定了 70% 的輸出結果,若都是用一線模型雖然略有差異,但無法產生決定性的影響。我認為替不同類型的文章客製化 Prompt 還是有其必要,EP22 的三篇的文章就是用專門為 FB 的科技類報導所訂製的 Prompt。

我認為效果不錯,三篇中有兩篇分享數超過 100

建立自動化系統

打磨出 Prompt 之後就是建立資料庫用大量的文章來測試它,我自己使用的是 Make 工作流平台,它可以不用寫任何一行程式碼,就可以搭建以往需要工程師協助才能建立的工作流,可說是外掛般的存在。

具體流程如下

用 Make 實現自動化

使用 RSS 訂閱國際科技媒體的熱點新聞,使用 Make 訪問 Perplexity / EXA 獲取相關報導的內容。再將報導內容餵給指定的 LLM 生成文章,最後將生成的文章歸檔到 Notion 中待修飾後發布。

不得不說,大力真的出奇蹟,輸入的報導數量會顯著的提升最終的結果,一篇報導與十篇報導能涵蓋的細節就是有差。這也體現自動化工作流的優勢,而你需要十篇論文還是百篇報導也只要調整數字就能放大需求。

無怪乎 Google 前 CEO 施密特強調,近乎無限的輸入窗口會對世界帶來改變。

產品化​

文、厂、生是為「產」,文代表方法,「品」由三個口組成,但我喜歡把它看成貨物堆疊起來的樣子。

而「產品」就是可以用方法製造且多到可以堆疊起來的東西

我認為 Prompt 就像 AI 文章的模具,自動化工作流就像產線,根據模具的定義將內容如流水線產出。

有趣的是,當你看著 notion 裡幾百篇生成的文章,才意識到,啊原來這就是總編輯的工作啊,才會感嘆技能點數不夠,還沒點到那邊。

下一步

接些來有關科技新聞的介紹應該就都會使用 AI 生成的( 關鍵的新聞還是會自己寫 )。若覺得之後某篇文章實在太糟了,請不吝留言痛罵我一下。

另外,我有發現 AI 很不會舉例跟說故事,即便 Prompt 詳細的指示它,但生成出來的文字完全沒有說服力。所以,心得類的文章還是會用手打的方式來呈現 ( 如同這篇 )。因此,大家不用擔心整個版面都是生成的文章,反而可以透過我去降噪科技類的新聞 ( 百裡挑一呀,脫窗 ​ )

最後,朋友一直敲碗我可以把方法整理成課程,但製作教學影片真的巨花時間 ( 看那停在第三集的YT )。而且根據我學習 AI 的經驗,現在規劃課程等到上架時可能都過時了。自己反而都是透過國外的 AI 社群來學習最即時知識與經驗。

因此我也設立了一個專為研究 AI 自動化工作流所打造的社群,裡面會手把手的帶你打造自己的 AI 「產品」。也會分享文章中提到的工作流以及專用 Prompt,希望大家可以透過這個系統打磨出不同領域 Alpha。

前 50 加入有優待,期待在社群中見到你。

HOTNEWS
Stable Diffusion 的新玩法

在 X 上看到超有趣的 AI 合成應用。
只要 Control Net + Lora 就可以玩出超多變化

拆解一下這個影片用到的模型:

  • AnimateDiff:生成連續動畫

  • IPAdapter:鎖定生成內容

  • Inpainting:描繪遮罩

  • ControlNet-depth:生成深度

  • Openpose:控制手部骨架

UI flow 應該是使用 ComfyUI,影片應該是用 After Effect 後製

雖然是個概念影片,不過如果能在 Vision Pro 或 Quest 3 上實現一定很好玩。

大家覺得還有什麼有趣的點子?

Reply

or to participate.