EP27 - OpenAI DveDay 將語音技術帶入市場

Realtime API。提示緩存。模型蒸餾

歡迎來到降噪,一起消除雜訊洞察價值

OVERVIEW
本期重點

  • OpenAI 2024 開發者大會

  • 我開了 AI 學習社群

HOTNEWS
OpenAI 2024 開發者大會

2024 OpenAI DevDay

在2024年10月2日的 OpenAI 開發者大會上,OpenAI 展示了許多令人矚目的新功能,這些功能不僅代表了AI技術的邊界拓展,也重塑了我們對生成式 AI 的看法。以下將詳細介紹在本次會議上推出的四大新 API 功能,並分析其對產業及未來發展的影響。

新功能概覽

這次OpenAI的公告包含了四項主要的 API 功能,為開發者的工具箱增添了新的利器:

1. Realtime API:允許開發者在應用中集成低延遲的語音到語音對話功能,並且在 Chat Completions API 中支援了音頻輸入和輸出,進一步擴展了開發者創建自然語言對話體驗的能力。

2. 視覺功能引入的微調 API:GPT-4o 的視覺微調功能,允許開發者使用圖像和文本數據集來提升模型的視覺理解能力,適用於各種應用,如增強的視覺搜索、改善自動駕駛車輛的物體檢測、智慧城市建設以及更準確的醫療影像分析。

3. API 提示緩存:此功能減少了重複請求造成的資源浪費,提升了 API 的調用效率及用戶的回應時間,對於尋求高效的應用開發者來說,是一個不可或缺的利器。

4. API 模型蒸餾:這項技術透過簡化大型預訓練模型,使得更小且高效的模型在資源有限的環境中也能運行,開發者能夠在平台上直接管理整個蒸餾流程,從而使用前沿模型的輸出來優化更經濟的模型性能,實現了強大AI能力的實際應用。

Realtime API 將語音技術帶入市場

OpenAI 在此次發布中不僅展示了其技術,還明確表達了其商業意圖。透過強化即時語音及模型蒸餾技術的應用,OpenAI 意在吸引更多投資者和用戶的注意,進一步鞏固其在市場中的競爭地位。

這些新技術讓 OpenAI 的產品線更具競爭力,特別是在智慧客服和語音助理領域,它們加速商業化應用提供了堅實支撐,同時也為 OpenAI 在中小企業中開展客製化解決方案打下基礎。

開發者試算了使用 Realtime API 來模擬一般客服的情境,若只計算 API 的費用一小時的使用費約$8.40美金,聽起來還是不便宜。但是這個客服設定好之後可以24/7全天候的接聽,不需要勞健保也沒有排班的需求。更甚,這個費用未來只會更便宜。

動起來搭建應用吧

OpenAI 的這些新技術無疑將在更廣泛的行業中引發變革。隨著 AI 技術的普及,百工百業將越來越依賴 AI 工具來提升產出效率。例如,簡單 AI 等工具能夠簡化創作流程,一般用戶也可以輕鬆掌握 AI 技術,從而改變了傳統的工作模式。

近期 OpenAI 也完成了新一輪歷史性的融資,籌集了 66 億美元,使其估值達到 1570 億美元。不只奠定其領先的地位,也預先告訴我們,OpenAI 已有計畫讓這 66 億美元的投資,未來產生數倍的應用價值,

自己贊助自己
我開了 AI 學習社群

有追蹤臉書的朋友應該知道我研究 Make 自動化系統有一段時間了。如果 Chat-GPT 是個不會喊累的博士,工作流則是能讓一群博士不分日夜地,像流水線般自動化的為您工作的系統。

Make 這個工具是我今年投入時間學習後獲得最大成效的工具。因為它可以把我先前介紹過的工具黏合起來變成全新的物種,就像樂高一樣。

👇 可以參考最新的教學影片理解工作流是如何運作的

期待在社群中見到你。

Reply

or to participate.