- 降噪 | denoise
- Posts
- EP27 - OpenAI DveDay 將語音技術帶入市場
EP27 - OpenAI DveDay 將語音技術帶入市場
Realtime API。提示緩存。模型蒸餾
歡迎來到降噪,一起消除雜訊洞察價值
OVERVIEW
本期重點
OpenAI 2024 開發者大會
我開了 AI 學習社群
HOTNEWS
OpenAI 2024 開發者大會
2024 OpenAI DevDay
在2024年10月2日的 OpenAI 開發者大會上,OpenAI 展示了許多令人矚目的新功能,這些功能不僅代表了AI技術的邊界拓展,也重塑了我們對生成式 AI 的看法。以下將詳細介紹在本次會議上推出的四大新 API 功能,並分析其對產業及未來發展的影響。
新功能概覽
這次OpenAI的公告包含了四項主要的 API 功能,為開發者的工具箱增添了新的利器:
1. Realtime API:允許開發者在應用中集成低延遲的語音到語音對話功能,並且在 Chat Completions API 中支援了音頻輸入和輸出,進一步擴展了開發者創建自然語言對話體驗的能力。
2. 視覺功能引入的微調 API:GPT-4o 的視覺微調功能,允許開發者使用圖像和文本數據集來提升模型的視覺理解能力,適用於各種應用,如增強的視覺搜索、改善自動駕駛車輛的物體檢測、智慧城市建設以及更準確的醫療影像分析。
3. API 提示緩存:此功能減少了重複請求造成的資源浪費,提升了 API 的調用效率及用戶的回應時間,對於尋求高效的應用開發者來說,是一個不可或缺的利器。
4. API 模型蒸餾:這項技術透過簡化大型預訓練模型,使得更小且高效的模型在資源有限的環境中也能運行,開發者能夠在平台上直接管理整個蒸餾流程,從而使用前沿模型的輸出來優化更經濟的模型性能,實現了強大AI能力的實際應用。
Realtime API 將語音技術帶入市場
OpenAI 在此次發布中不僅展示了其技術,還明確表達了其商業意圖。透過強化即時語音及模型蒸餾技術的應用,OpenAI 意在吸引更多投資者和用戶的注意,進一步鞏固其在市場中的競爭地位。
這些新技術讓 OpenAI 的產品線更具競爭力,特別是在智慧客服和語音助理領域,它們加速商業化應用提供了堅實支撐,同時也為 OpenAI 在中小企業中開展客製化解決方案打下基礎。
開發者試算了使用 Realtime API 來模擬一般客服的情境,若只計算 API 的費用一小時的使用費約$8.40美金,聽起來還是不便宜。但是這個客服設定好之後可以24/7全天候的接聽,不需要勞健保也沒有排班的需求。更甚,這個費用未來只會更便宜。
動起來搭建應用吧
OpenAI 的這些新技術無疑將在更廣泛的行業中引發變革。隨著 AI 技術的普及,百工百業將越來越依賴 AI 工具來提升產出效率。例如,簡單 AI 等工具能夠簡化創作流程,一般用戶也可以輕鬆掌握 AI 技術,從而改變了傳統的工作模式。
近期 OpenAI 也完成了新一輪歷史性的融資,籌集了 66 億美元,使其估值達到 1570 億美元。不只奠定其領先的地位,也預先告訴我們,OpenAI 已有計畫讓這 66 億美元的投資,未來產生數倍的應用價值,
自己贊助自己
我開了 AI 學習社群
有追蹤臉書的朋友應該知道我研究 Make 自動化系統有一段時間了。如果 Chat-GPT 是個不會喊累的博士,工作流則是能讓一群博士不分日夜地,像流水線般自動化的為您工作的系統。
Make 這個工具是我今年投入時間學習後獲得最大成效的工具。因為它可以把我先前介紹過的工具黏合起來變成全新的物種,就像樂高一樣。
👇 可以參考最新的教學影片理解工作流是如何運作的
期待在社群中見到你。
Reply