降噪 | denoise
Posts
EP16 - OpenAI 推出 GPT-4o mini 與革命性搜索引擎 Exa AI

EP16 - OpenAI 推出 GPT-4o mini 與革命性搜索引擎 Exa AI

GPT-4o mini | Exa AI | H2O-Danube3

Winston
July 23, 2024

歡迎來到降噪，一起消除雜訊洞察價值

OVERVIEW
本期重點

OpenAI 推出 GPT-4o mini
專為 AI 設計的革命性搜索引擎 Exa AI
手機上運行的開源模型 H2O-Danube3

HOTNEWS
OpenAI 推出 GPT-4o mini

OpenAI

價格僅 10 分之一

OpenAI 剛剛推出了一款令人興奮的新模型：GPT-4o mini。

▋ 性能卓越，價格親民

它不僅在性能上超越了許多知名的 AI 模型，包括 GPT-3.5 Turbo、Gemini Flash 和 Claude Haiku，而且價格便宜得令人難以置信。

每百萬輸入 Tokens 只需 15 美分，每百萬輸出 Tokens 60 美分。

這比之前的頂級模型便宜了十倍，比 GPT-3.5 Turbo 便宜了 60% 以上！

▋ 便宜不代表性能差

GPT-4o mini 在多項重要測試中都表現出色

GPT4o-mini 各項指標

1. 在 MMLU（衡量文本智能和推理能力的基準）上得分 82.0%，超過了 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。

2. 在數學推理測試 MGSM 上得分 87.0%，遠高於競爭對手。

3. 在編程能力測試 HumanEval 上得分 87.2%，同樣領先其他模型。

GPT-4o mini不僅僅是一個文本處理工具，它的才能遠不止於此：

支援文本和視覺輸入，未來還將支援圖像、影片和音頻的輸入輸出。

擁有128K標記的上下文窗口，每次請求最多可輸出16K標記。

知識覆蓋範圍廣泛，更新至2023年10月。

改進的標記器使得處理非英語文本更具成本效益。

從今天開始，免費用戶、Plus用戶和Team用戶都可以使用GPT-4o mini，企業用戶也將很快獲得訪問權限。

GPT-4o mini: advancing cost-efficient intelligence

Introducing the most cost-efficient small model in the market

SHARING
專為 AI 設計的革命性搜索引擎 Exa AI

Exa AI

Exa AI 詳細解密

若是有一個搜尋引擎能夠真正理解我們的問題，而不是單純匹配關鍵字？

可以試著 Google 「正在為核融合努力的新創公司」，你會得到一堆塞滿關鍵字的無關網頁。

是不是很惱人？

現在，讓我們來認識一下 Exa AI —— 一個可能徹底改變我們使用網路方式的新型搜尋引擎。

Exa AI 不是另一個試圖取代 Google 的搜尋引擎。

它的目標更加遠大：打造一個專為 AI 量身定制的搜尋工具。

這聽起來可能有點抽象，但我相信，Exa AI 有機會改變我們獲取資訊的方式。

▋ Exa AI 如何運作？

傳統的搜尋引擎主要依賴關鍵字匹配。但 Exa AI 採用了更加先進的方法：

1. 它使用向量資料庫和嵌入模型（embedding models）技術，將每個網頁賦予了權重。

這聽起來很複雜，但簡單來說，就是它能夠理解網頁的實際含義，並讓彼此之間有了對應的關係。

2. Exa AI 不是預測下一個詞，而是預測下一個相關連結。

這意味著它能夠更好地理解網頁之間的關係，為你找到真正相關的資訊。

3. 它使用端到端的 Transformer 技術（就是 ChatGPT 使用的那種）來過濾資訊。

這使得 Exa AI 能夠根據意義而不是關鍵字來篩選結果，還能因此過濾掉惱人的 SEO haker 創造出來的內容。

同樣是找論文 EXA 給的結果更好

舉個例子：如果你搜尋「正在為核融合努力的新創公司」，Exa AI 會真正理解你的意圖，找到真正在解決核融合問題的公司，而不是那些只是在網頁上堆砌關鍵字的公司。

下面是我用 Exa AI 搜尋出來的公司，在 Google search 只給我一堆媒體的報導。

Exa AI：

helicalfusion.com 日本團隊的官網

renfusion.eu 歐洲團隊的官網

okamakenergy.com 英美團隊的官網

Google：

創業小聚

袋鼠金融

Yahoo 新聞

▋ Exa AI 的獨特之處

1. 語義搜尋：它能理解你的問題的實際含義，而不只是匹配關鍵字。

2. 內容擷取：它可以從任何網頁抓取完整、乾淨的內容，為 AI 提供高品質的資料。

3. 相似性搜尋：你可以用一個 URL 或一段長文本來找到類似的結果，讓搜尋更精準。

4. 大規模資料處理：它能處理多達 100 萬條搜尋結果，滿足 AI 對大量資料的需求。

5. 即時更新：每分鐘都在爬取新的 URL，確保你能獲得最新的資訊。

6. 強大的過濾功能：你可以按域名、日期範圍或資料類別進行搜尋，讓結果更符合你的需求。

7. 簡單的 API 整合：開發者只需幾行程式碼就可以使用 Exa AI 的搜尋功能。

API API API 很重要。

▋ Exa AI 的未來

Exa raises $17M from Lightspeed, Nvidia, Y Combinator to build a Google for AIs | TechCrunch

While there’s no shortage of startups aiming to replace Google with AI-powered search, a startup called Exa has a different idea. Search for the AIs.

Exa AI 最近獲得了 1700 萬美元的 A 輪融資。

由 Lightspeed 領投，Nvidia 的 NVentures 和 Y Combinator 參投。

這表明了投資者對這項技術的信心。

但 Exa AI 的真正價值不僅僅在於它的技術創新。

它的意義在於它可能徹底改變我們與資訊互動的方式。

想像一下，當我們的 AI 助手能夠真正理解我們的問題，並從海量的網路資料中精確地找到答案，串接到你的服務裡會發生什麼？

▋ 感想

在這之前，我們認為搜尋引擎就是輸入關鍵字，然後從一堆結果中找出有用的資訊。

但現在，Exa AI 的出現讓我們看到了另一種可能：透過真正理解每個網頁的內容，給每個網頁屬於自己的權重。

Perplexity 做了一個很好的開頭。

它的原理是根據關鍵字去爬取相關網頁的內容，再把這些內容整理成一則搜尋的總結。

但本質上還是透過關鍵字來做搜尋，僅是在輸入與輸出添加了生成式 AI 。

無外乎它一直承受套殼搜尋引擎的罵名。

Exa AI 則是把每個網頁當成一個 Token ，透過海量的訓練重新建構了一個網路知識圖譜。

這也是為什麼他們可以做相似內容網頁的搜尋，甚至精準的回覆使用者需求。

十分看好這種從底層邏輯改變生態的方法，實際使用也真的讓我發現以往不曾造訪的網站與內容。

側邊欄分類好好用

搜尋結果頁面，左邊側邊欄的網站分類真是一絕，真的把 Google 跟 Perplexity 吊起來打一圈。

快來試試這個強大的真 AI 搜尋引擎。

Exa | Web API for AI

Find exactly what you are looking for

exa.ai/search

HOTNEWS
手機上運行的開源模型 H2O-Danube3

H2O Danube3 - a h2oai Collection

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

模型下載

搶在 Apple Intelligence 之前

── H2O-Danube3 發佈手機上運行的開源模型

H2O-Danube3 是一個由 H2O.ai 開發的一系列小型語言模型。此模型能夠提供聊天、問答服務、文字分類、資料分析等功能。

▊ 模型大小

H2O-Danube3 有兩個版本分別為

H2O-Danube3-4B 在 6T Token 上訓練

H2O-Danube3-500M 在 4T Token 上訓練

H2O-Danube3 最大僅有 4B 因此能夠在普通邊緣硬體設備（如智慧型手機）上運行，且無需連接網路。

▊ 重點能力

- 通用語言任務：模型在序列分類、問答系統、token 分類等任務中表現優異，甚至在經過微調後能夠在特定任務上超過一些大型模型。

- 聊天能力：提供了 H20-Danube3-4B-Chat 和 H20-Danube3-500M-Chat 版本，專門針對聊天任務進行了最佳化和微調。

- 多語言處理：支援處理多種語言的文本，能夠進行多語言生成和理解。

- 語言翻譯：將文字從一種語言翻譯到另一種語言，支援多種語言。

-資料摘要：對結構化資料進行分析和總結，產生資料報告。從數據中提取有價值的洞察，產生分析報告。

▊ 影響

當大家都還在懷疑 Apple 是否真的能在手機上順暢運行 LLM 時。

H2O.ai 給了大家一個可靠的答案。

驚人的是，它不僅迅速 ( 可以看影片未加速 )

還可以順暢的運行在我 Iphone14 Pro 的手機上 ( Apple 要不要出來說明一下！ )

它支援 Apache 2.0 許可使用，也就是說任何人都可以 Fine-tune 它來商用。

最大 4B 的 Size 若要做 Fine-tune 僅需要普通大眾使用的顯卡即可 ( 8G以上 )

500M 的 Fine-tune 將能更佳的友善。

可以預期這個開源模型將打開一條全新的道路，那就是

訓練模型將不再只是擁有巨大資源公司的權力。

未來所有應用將有機會嵌入自己訓練過的小模型。

不管是遊戲角色需要生成的台詞，或是協助使用者解決問題的助理。

都有機會透過這個本地運行的小模型來實現！

非常期待幾個月後開發者在這個基礎上延伸出來的應用。

喔對了，這個應用已經可以在 AppStore 下載，有興趣的朋友不妨下載來玩看看。

‎H2O AI Personal GPT

‎Say hello to H2O's Personal GPT, the AI assistant from the makers of Open Source H2O-3 that lives right on your phone. Enjoy all the benefits of a smart, conversational AI without worrying about your data, questions, or responses leaving your device. Whether you need help drafting emails, creating t…

AppStore 連結

Reply

or to participate.

EP16 - OpenAI 推出 GPT-4o mini 與革命性搜索引擎 Exa AI

GPT-4o mini | Exa AI | H2O-Danube3

歡迎來到降噪，一起消除雜訊洞察價值

OVERVIEW本期重點

HOTNEWSOpenAI 推出 GPT-4o mini

SHARING專為 AI 設計的革命性搜索引擎 Exa AI

HOTNEWS手機上運行的開源模型 H2O-Danube3

Reply

OVERVIEW
本期重點

HOTNEWS
OpenAI 推出 GPT-4o mini

SHARING
專為 AI 設計的革命性搜索引擎 Exa AI

HOTNEWS
手機上運行的開源模型 H2O-Danube3