- 降噪 | denoise
- Posts
- EP31 - 大型語言模型的本質以及正確的用法
EP31 - 大型語言模型的本質以及正確的用法
數據星雲。LLM。Attention is all you need
歡迎來到降噪,一起消除雜訊洞察價值
OVERVIEW
本期重點
大型語言模型的本質以及正確的用法
我開了 AI 自動化工作流的學習社群
SHARING
大型語言模型的本質以及正確的用法
大麥哲倫星雲。哈伯望遠鏡攝
仰望夜空中閃爍的星光,我們不禁感受到在浩瀚宇宙中的渺小。在這無垠的宇宙維度裡,萬事萬物都只是其中的一個子集。而在這浩瀚中,我們唯一確定的,就是自己這個無法撼動的觀測點。
大型語言模型裡的星雲
這個觀察不僅適用於宇宙,也適用於我們理解大型語言模型( LLM )的方式。如果有機會讓你置身於 LLM 的核心,抬頭仰望,你會看什麼樣的風景?
你會發現無數的「資料點」,如同銀河系中的星辰,密密麻麻地交織成壯觀的數據星雲。這些點並非隨機分布,而是通過 Embedding( 嵌入 )技術,將文字、圖像、聲音等多樣化的內容轉換成向量,賦予它們在三維空間中的精確座標。
由一萬個參數構成的小模型視覺化後的樣子 source:tako-analytics
這種向量化技術的突破,讓我們得以將不同形式的資料置於同一個空間中比對關聯性。這就是為什麼 LLM 能夠如此擅長翻譯,甚至能夠將文字轉化為圖像或音樂的原因。本質上,它只是在尋找相鄰的資料點,不論這些點代表的是文字、圖像還是聲音。
因此,生成式 AI 本質上是一場資料儲存與檢索的革命。這項技術不再受限於傳統的欄位式儲存與標籤系統,而是創造了一個全新的資料處理模式。就像一位廚師突然發現可以用音樂作為食材,開創出前所未有的料理可能性。
大型語言模型的正確用法
理解這個本質後,我們就能更好地把握這項技術的優劣勢。當你輸入文字時,實際上是在這片數據星雲中定位特定的座標。這就是為什麼優質的輸入資料和提示詞(Prompt)如此重要。因為如果座標位置不夠明確,就如同打開 Google map 在北極找企鵝,除了一樣很冷但你找不到任何的企鵝。
分布在三維空間中的參數雲 source:tako-analytics
所以不要把使用搜尋引擎的習慣用到 LLM 上,盡可能的給出過量的輸入。
對!我說的是過量。
你要想像你要進行一趟宇宙飛行,行星就是你的目的地,因此你必須盡可能的提供詳細的座標資訊,不然你永遠都到達不了。
舉例來說,要生成一份簡歷,與其簡單要求「寫一份 300 字的簡歷」,不如先收集十份優秀範本作為基礎。甚至可以使用爬蟲爬取上千份目標職位的 LinkedIn 簡介,再把這些資「料」丟給 LLM 處「理」,讓 LLM 在更豐富的資料基礎上進行比對。
這才是發揮 LLM 最大優勢的用法 ( 窗口最大化 / GPU 運算最大化 )。
大家愛用的 Perplexity 也是同樣的邏輯,它只是幫你把搜尋的內容提取出來並丟到 LLM 總結,省下你找網頁複製貼上的功夫。所以,請給 LLM 過量的訊息,這個動作就像在星圖上標記更多參考點,幫助它更精確地定位你所需的內容。
這也是為什麼我這麼著迷自動化工作流的關係,因為十則內容你可能還能手動的複製貼上,但若是上千則的內容,自動化工作流就是槓桿這些過量內容最好的工具。
Attention is all you need
然而,即便 LLM 如此強大,人類的角色依然無可取代。即便宇宙如此的浩瀚,還是無法撼動自己身為觀測點這件事。沒有你的觀測,宇宙再大都與你無關。地球的沙子再多,沒有人類不懈的研究也永遠無法成為晶片。
同理,LLM 的參數再多,沒有你的探索它一點用都沒有。關鍵在於如何提升我們作為觀測者的品味與互動頻率,拿來充分發揮 LLM 的潛力。我甚至認為未來某個研究機構會推出一個新的指標,叫做國民/企業每日平均 GPU 使用量,來衡量生產力表現,如同過往使用網速來反映數位化程度。
source: NASA
一如 Sam Altman 所說,我們仍處於早期階段。若我們把一個參數類比成一顆行星,以現今最大的 AI 模型 Grok-1 的 3140億個參數來看。相較於可觀測宇宙中數千億個星系,每個星系中包含數億顆行星的規模。我們目前 LLM 的參數量頂多只夠描繪星系的輪廓,距離填滿整個知識宇宙還有數億倍要覆蓋。
我們還在 Early Stage。
自己贊助自己
我開了 AI 自動化工作流的學習社群
有追蹤臉書的朋友應該知道我研究 Make 自動化系統有一段時間了。如果 Chat-GPT 是個不會喊累的博士,工作流則是能讓一群博士不分日夜地,像流水線般自動化的為您工作的系統。
相信大家也聽我介紹很多 AI 工具,常常有種怎麼也學不完的挫敗感。但 Make 這個工具是我今年投入時間學習後獲得最大成效的工具。因為它可以把我先前介紹過的工具黏合起來變成全新的物種,就像樂高一樣。
👇 可以參考最新的教學影片理解工作流是如何運作的
期待在社群中見到你。
Reply