- 降噪 | denoise
- Posts
- EP16 - OpenAI 推出 GPT-4o mini 與革命性搜索引擎 Exa AI
EP16 - OpenAI 推出 GPT-4o mini 與革命性搜索引擎 Exa AI
GPT-4o mini | Exa AI | H2O-Danube3
歡迎來到降噪,一起消除雜訊洞察價值
OVERVIEW
本期重點
OpenAI 推出 GPT-4o mini
專為 AI 設計的革命性搜索引擎 Exa AI
手機上運行的開源模型 H2O-Danube3
HOTNEWS
OpenAI 推出 GPT-4o mini

OpenAI
價格僅 10 分之一
OpenAI 剛剛推出了一款令人興奮的新模型:GPT-4o mini。
-
▋ 性能卓越,價格親民
它不僅在性能上超越了許多知名的 AI 模型,包括 GPT-3.5 Turbo、Gemini Flash 和 Claude Haiku,而且價格便宜得令人難以置信。
每百萬輸入 Tokens 只需 15 美分,每百萬輸出 Tokens 60 美分。
這比之前的頂級模型便宜了十倍,比 GPT-3.5 Turbo 便宜了 60% 以上!
-
▋ 便宜不代表性能差
GPT-4o mini 在多項重要測試中都表現出色

GPT4o-mini 各項指標
1. 在 MMLU(衡量文本智能和推理能力的基準)上得分 82.0%,超過了 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。
2. 在數學推理測試 MGSM 上得分 87.0%,遠高於競爭對手。
3. 在編程能力測試 HumanEval 上得分 87.2%,同樣領先其他模型。
GPT-4o mini不僅僅是一個文本處理工具,它的才能遠不止於此:
支援文本和視覺輸入,未來還將支援圖像、影片和音頻的輸入輸出。
擁有128K標記的上下文窗口,每次請求最多可輸出16K標記。
知識覆蓋範圍廣泛,更新至2023年10月。
改進的標記器使得處理非英語文本更具成本效益。
從今天開始,免費用戶、Plus用戶和Team用戶都可以使用GPT-4o mini,企業用戶也將很快獲得訪問權限。
SHARING
專為 AI 設計的革命性搜索引擎 Exa AI

Exa AI
Exa AI 詳細解密
若是有一個搜尋引擎能夠真正理解我們的問題,而不是單純匹配關鍵字?
可以試著 Google 「正在為核融合努力的新創公司」,你會得到一堆塞滿關鍵字的無關網頁。
是不是很惱人?
現在,讓我們來認識一下 Exa AI —— 一個可能徹底改變我們使用網路方式的新型搜尋引擎。
Exa AI 不是另一個試圖取代 Google 的搜尋引擎。
它的目標更加遠大:打造一個專為 AI 量身定制的搜尋工具。
這聽起來可能有點抽象,但我相信,Exa AI 有機會改變我們獲取資訊的方式。
-
▋ Exa AI 如何運作?
傳統的搜尋引擎主要依賴關鍵字匹配。但 Exa AI 採用了更加先進的方法:
1. 它使用向量資料庫和嵌入模型(embedding models)技術,將每個網頁賦予了權重。
這聽起來很複雜,但簡單來說,就是它能夠理解網頁的實際含義,並讓彼此之間有了對應的關係。
2. Exa AI 不是預測下一個詞,而是預測下一個相關連結。
這意味著它能夠更好地理解網頁之間的關係,為你找到真正相關的資訊。
3. 它使用端到端的 Transformer 技術(就是 ChatGPT 使用的那種)來過濾資訊。
這使得 Exa AI 能夠根據意義而不是關鍵字來篩選結果,還能因此過濾掉惱人的 SEO haker 創造出來的內容。

同樣是找論文 EXA 給的結果更好
舉個例子:如果你搜尋「正在為核融合努力的新創公司」,Exa AI 會真正理解你的意圖,找到真正在解決核融合問題的公司,而不是那些只是在網頁上堆砌關鍵字的公司。
下面是我用 Exa AI 搜尋出來的公司,在 Google search 只給我一堆媒體的報導。
Exa AI:
helicalfusion.com 日本團隊的官網
renfusion.eu 歐洲團隊的官網
okamakenergy.com 英美團隊的官網
Google:
創業小聚
袋鼠金融
Yahoo 新聞
-
▋ Exa AI 的獨特之處
1. 語義搜尋:它能理解你的問題的實際含義,而不只是匹配關鍵字。
2. 內容擷取:它可以從任何網頁抓取完整、乾淨的內容,為 AI 提供高品質的資料。
3. 相似性搜尋:你可以用一個 URL 或一段長文本來找到類似的結果,讓搜尋更精準。
4. 大規模資料處理:它能處理多達 100 萬條搜尋結果,滿足 AI 對大量資料的需求。
5. 即時更新:每分鐘都在爬取新的 URL,確保你能獲得最新的資訊。
6. 強大的過濾功能:你可以按域名、日期範圍或資料類別進行搜尋,讓結果更符合你的需求。
7. 簡單的 API 整合:開發者只需幾行程式碼就可以使用 Exa AI 的搜尋功能。
API API API 很重要。
-
▋ Exa AI 的未來
Exa AI 最近獲得了 1700 萬美元的 A 輪融資。
由 Lightspeed 領投,Nvidia 的 NVentures 和 Y Combinator 參投。
這表明了投資者對這項技術的信心。
但 Exa AI 的真正價值不僅僅在於它的技術創新。
它的意義在於它可能徹底改變我們與資訊互動的方式。
想像一下,當我們的 AI 助手能夠真正理解我們的問題,並從海量的網路資料中精確地找到答案,串接到你的服務裡會發生什麼?
-
▋ 感想
在這之前,我們認為搜尋引擎就是輸入關鍵字,然後從一堆結果中找出有用的資訊。
但現在,Exa AI 的出現讓我們看到了另一種可能:透過真正理解每個網頁的內容,給每個網頁屬於自己的權重。
Perplexity 做了一個很好的開頭。
它的原理是根據關鍵字去爬取相關網頁的內容,再把這些內容整理成一則搜尋的總結。
但本質上還是透過關鍵字來做搜尋,僅是在輸入與輸出添加了生成式 AI 。
無外乎它一直承受套殼搜尋引擎的罵名。
Exa AI 則是把每個網頁當成一個 Token ,透過海量的訓練重新建構了一個網路知識圖譜。
這也是為什麼他們可以做相似內容網頁的搜尋,甚至精準的回覆使用者需求。
十分看好這種從底層邏輯改變生態的方法,實際使用也真的讓我發現以往不曾造訪的網站與內容。

側邊欄分類好好用
搜尋結果頁面,左邊側邊欄的網站分類真是一絕,真的把 Google 跟 Perplexity 吊起來打一圈。
快來試試這個強大的真 AI 搜尋引擎。
HOTNEWS
手機上運行的開源模型 H2O-Danube3
搶在 Apple Intelligence 之前
── H2O-Danube3 發佈手機上運行的開源模型
H2O-Danube3 是一個由 H2O.ai 開發的一系列小型語言模型。此模型能夠提供聊天、問答服務、文字分類、資料分析等功能。
-
▊ 模型大小
H2O-Danube3 有兩個版本分別為
H2O-Danube3-4B 在 6T Token 上訓練
H2O-Danube3-500M 在 4T Token 上訓練
H2O-Danube3 最大僅有 4B 因此能夠在普通邊緣硬體設備(如智慧型手機)上運行,且無需連接網路。
-
▊ 重點能力
- 通用語言任務:模型在序列分類、問答系統、token 分類等任務中表現優異,甚至在經過微調後能夠在特定任務上超過一些大型模型。
- 聊天能力:提供了 H20-Danube3-4B-Chat 和 H20-Danube3-500M-Chat 版本,專門針對聊天任務進行了最佳化和微調。
- 多語言處理:支援處理多種語言的文本,能夠進行多語言生成和理解。
- 語言翻譯:將文字從一種語言翻譯到另一種語言,支援多種語言。
-資料摘要:對結構化資料進行分析和總結,產生資料報告。從數據中提取有價值的洞察,產生分析報告。
-
▊ 影響
當大家都還在懷疑 Apple 是否真的能在手機上順暢運行 LLM 時。
H2O.ai 給了大家一個可靠的答案。
驚人的是,它不僅迅速 ( 可以看影片未加速 )
還可以順暢的運行在我 Iphone14 Pro 的手機上 ( Apple 要不要出來說明一下! )
它支援 Apache 2.0 許可使用,也就是說任何人都可以 Fine-tune 它來商用。
最大 4B 的 Size 若要做 Fine-tune 僅需要普通大眾使用的顯卡即可 ( 8G以上 )
500M 的 Fine-tune 將能更佳的友善。
可以預期這個開源模型將打開一條全新的道路,那就是
訓練模型將不再只是擁有巨大資源公司的權力。
未來所有應用將有機會嵌入自己訓練過的小模型。
不管是遊戲角色需要生成的台詞,或是協助使用者解決問題的助理。
都有機會透過這個本地運行的小模型來實現!
非常期待幾個月後開發者在這個基礎上延伸出來的應用。
喔對了,這個應用已經可以在 AppStore 下載,有興趣的朋友不妨下載來玩看看。
Reply