媒體界 - 推動中國媒體行業創新,促進業內人士交流分享!

谷歌文本轉圖像人工智能模型 Imagen 首次公開亮相

   發布時間:2022-11-03 11:38 作者:遠洋

11 月 3 日消息,谷歌在發布其文本轉圖像的人工智能系統方面極為謹慎,盡管該公司的 Imagen 模型產生的輸出質量與 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相當,但谷歌此前并沒有將該系統向公眾開放。

不過今天,這家搜索巨頭宣布將把 Imagen 以非常有限的形式添加到其 AI Test Kitchen 應用中,作為一種收集關于該技術的早期反饋的方式。

AI Test Kitchen 是在今年早些時候推出的,目的是對谷歌的各種 AI 系統進行測試。目前,該應用程序提供了一些不同的方式與谷歌的文本模型 LaMDA 進行互動,該公司很快將增加類似的限制性 Imagen 請求,作為其所謂的應用程序“第二季”更新的一部分。簡而言之,將有兩種方式與 Imagen 互動:城市夢想家和 Wobble。

在“城市夢想家”中,用戶可以要求模型生成圍繞他們選擇的主題設計的城市元素,例如,南瓜、牛仔布。Imagen 創建了樣本建筑和地塊(城市廣場、公寓樓、機場等等),所有的設計都以類似于在《模擬城市》中看到的等距模型出現。

在 Wobble 中,你可以創造一個小怪物。可以選擇它的材質(粘土、毛氈、杏仁糖、橡膠),然后給它穿上你選擇的衣服。該模型會生成你的怪物,給它起個名字,然后你可以戳戳它,讓它“跳舞”。

與其它文本到圖像的模式相比,這些互動是非常受限制的,用戶不能隨便創造他們喜歡的東西。不過,這也是谷歌有意為之。谷歌產品管理高級總監喬希-伍德沃德(Josh Woodward)解釋稱,AI Test Kitchen 的全部意義在于:a)獲得公眾對這些 AI 系統的反饋;b)測試哪些行為會使得系統崩潰。

不過最大的問題是,谷歌是否會想把這些模型推向更廣泛的公眾,會采取什么形式?目前,該公司的競爭對手 OpenAI 和 Stability AI 正急于將文本-圖像模型商業化,谷歌是否會覺得自己的系統足夠安全,可以走出 AI Test Kitchen 提供給用戶?

 
 
更多>同類內容
全站最新
熱門內容
本欄最新