EP13 - AI 是產品還是功能?配音也能生成了!

WWDC | V2A | DeepMind | 噪噪溫斯頓

歡迎來到降噪,一起消除雜訊洞察價值

OVERVIEW
本期重點

  • AI 是產品還是功能?

  • 無聲影片瞬間有聲!

  • 100% 自動化臉書小編機器人

SHAREING
AI 是產品還是功能?

source:MKVHD

週末看了 MKVHD 的一支影片,裡面討論了一個觀點,讓我深有同感:

AI 到底是產品還是功能?

最近,Apple 的 WWDC 活動展示了許多 AI 技術,但這些 AI 更像是嵌入現有產品中的功能,而非獨立的產品。

這個觀點非常有趣,因為它促使我們思考新興技術的真正價值究竟在於其本身,還是在於其如何提升已有產品的價值。

讓我們先回顧一下 Clubhouse 的例子。

▊ 產品變成功能

Clubhouse 在疫情期間迅速崛起,成為一個熱門的平台,讓人們可以參與即時的音頻討論。

Clubhouse

然而,好景不長,Spotify、Discord、Slack,甚至 Twitter 很快就將類似的功能整合到各自的應用中。

Spotify 有 Greenroom,Discord 有 Stages,Slack 也有了類似的功能,Twitter 更是推出了 Spaces。

這些大平台的動作,最終導致了 Clubhouse 的熱度逐漸消退。

這個例子很好地說明了,當一個功能被大平台複製並整合後,獨立的產品往往會面臨生存危機。

這讓我不禁思考, 既有的產品導入 AI 功能後,這些新的 AI 服務會如何?

▊ AI 就是個功能

以 Apple 和 Google 的做法為例,這兩家公司選擇將 AI 作為提升用戶體驗的功能來使用。

Apple WWDC 2024

Apple 在最新的 WWDC 活動中,展示了許多嵌入在各種應用中的 AI 功能。

例如,Siri 現在可以更好地進行對話和理解上下文,新的語言模型可以幫助用戶撰寫、總結和校對文本,甚至還可以生成圖像和表情符號。

這些 AI 功能無疑讓 Apple 的產品更具吸引力和實用性。

與此同時,Google 也在其產品中廣泛應用了 AI 技術。

Google I/O 活動展示了許多新的 AI 功能,這些功能無縫地整合在其現有的服務中,讓用戶在使用時感到更加便捷和智能。

▊ 功能強大就是一個產品

當然,也有一些公司嘗試推出獨立的 AI 產品,比如 Humane AI Pin 和 Rabbit r1。這些產品試圖成為用戶隨身攜帶的智能助手,提供專門的 AI 服務。

Limitless

然而,這些嘗試並未取得預期的成功。

這說明了作為獨立產品的 AI 面臨著更大的挑戰,因為它們不僅需要在功能上出色,還需要在使用者體驗和市場接受度上取得突破。

但市場上就是會有特例,如 TikTok 和 Snapchat,則因為功能本身具備獨特的價值和強大的用戶粘性。

TikTok 以其獨特的短影音算法和用戶體驗,成功抵禦了 Instagram Reels 和 YouTube Shorts 的競爭。

而 Snapchat 雖然其故事功能被多個平台模仿,但其獨特的用戶群體和創新功能讓它仍然具有市場競爭力。

這樣的趨勢是否適用於 AI?需要多強大才能稱為產品?

▊ 感想

從目前的情況看,大多數用戶似乎更傾向於在熟悉的應用中使用 AI 功能,而不是轉向全新的 AI 產品。

這可能是因為整合的功能能夠更好地利用現有的生態系統和用戶基礎,從而提供更一致和無縫的使用體驗。

也不要說預不預言,雖然 Adobe 目前不在大家主流的 AI 產品 List 中,但我相當看好它後續慢慢把這些功能整合上去之後所產生的綜效。

因此,我認為對於那些想要在 AI 領域打造產品的公司來說,這會是一個重要的啟示。

與其試圖創造一個完全獨立的 AI 產品,也許更現實的策略是與大平台合作。

將 AI 功能嵌入到已有的應用中,這樣可以更快地觸及廣泛的用戶群體,同時降低市場風險。

總結來說,AI 作為產品和功能各有其優勢和挑戰。

作為功能,AI 可以更快地普及並提升現有產品的價值;而作為產品,AI 則需要更強的創新和市場推廣能力。

未來的 AI 發展趨勢將如何演變,仍需我們持續觀察和探討。

HOTNEWS
無聲影片瞬間有聲!

Deepmind V2A 利用影像與文字生成音頻

這幾天 Luma.ai, Runway 以及快手相繼發佈最新版本的文字生成影像的模型。

真是肉眼可見的進步呀!

但看著看著,總覺得影片少了些什麼?

沒錯,就是缺少了生動的音效和配樂啊!

今天,Google Deepmind 站出來發佈最新的影片轉音頻(V2A)的技術。

它可以根據影片畫面和你的文字描述,自動為影片添加逼真的音軌!

不僅有動聽的背景音樂,還能模擬出真實的環境音效。

甚至自動合成對話聲音!只需要描述一下需求,V2A 就能生成與影片完美同步的音頻!

無論是為無聲影片添加背景音樂,為老電影制作音軌,還是為社交媒體影片添加特殊音效,V2A 都能輕鬆勝任。

此外,電影制作人和創意工作者也可以利用 V2A 快速試驗不同的音效組合,找到最適合他們作品的聲音。

▋ 主要功能

V2A 的技術流程圖

◆ 音頻生成:

V2A可以根據影片畫面和用戶提供的文字描述,自動生成與影片內容同步的音軌。這包括背景音樂、環境音效甚至與影片內容匹配的對話。

◆ 同步音頻:

能夠確保生成的音頻與影片內容完美同步,使得影片和音頻之間沒有任何延遲或錯位。這對於增強觀眾的觀看體驗至關重要。

◆ 多樣化音軌:

用戶可以為任何影片生成無限數量的音軌,從而嘗試不同的音效組合,找到最適合影片內容的音樂。V2A 提供了極大的創意空間,讓用戶自由探索和實驗。

◆ 創意提示:

V2A 支持“正向提示”和“負向提示”功能。正向提示可以引導模型生成所需的特定聲音,而負向提示則可以避免生成不希望出現的聲音。通過這些提示,用戶可以精確控制生成的音頻效果。

◆ 高品質音頻:

為了生成高品質的音頻,V2A 在訓練過程中引入了詳細的音樂描述和對話轉錄。這些附加訊息幫助模型學習在不同視覺場景中生成特定的音頻軌,確保生成的音軌真實且富有表現力。

◆ 自動化處理:

V2A 系統不需要手動校準生成的聲音與影片,這減少了調整聲音、視覺和時間元素的繁瑣工作。用戶可以專注於創意和內容,而不必擔心技術細節 ( 這個超棒啊! )

▋ 感想

V2A 模型會是影音創作領域的一大突破,它將能改變製作影片的流程和體驗。

過去,要為無聲影片添加音軌總是費時費力。

不僅需要尋找合適的音效素材,還要一一校準聲音與影像的同步。

再三調試音量大小、音色效果等細節,實在是一件瑣碎的工作。

而現在,有了 V2A 這個 AI 生成模型,聲音的創作將迎來新的世代。

有別於 Suno.ai 僅靠文字來生成,V2A 因為加入了影像的辨識,讓聲音的輸入與創作自此多了更多可能性。

科技的進步正在逐步消除創作過程中的技術障礙,讓我們能夠更加專注於內容本身的創作。

V2A 這個技術無疑是通往更高創作效率的重要一步 ( 想像它內建在影像製作軟體裡 ),它必將為影音製作帶來全新的體驗。

SHAREING
100%自動化臉書小編機器人

100%自動化臉書小編機器人

本週的影片教學要分享的是:

如何使用 Make.com 以及 ChatGPT 來建立自動化的回覆小編機器人。

過往必須支付一筆費用才能使用的行銷工具,現在透過自動化工具。

不需要寫一行程式碼,也能簡單打造自己的行銷機器人。

後續還能串接各大 CRM 平台做顧客管理,一個工具就能替代好多服務。

非常推薦有興趣的朋友可以學習研究。

當然,有任何問題以及需求都可以留言來跟我討論。

一起把這個強大的工具學起來,推廣給更多的人用。

本次的工作流:

EP03-100%自動化臉書小編機器人.json36.22 KB • JSON File

Reply

or to participate.