谷歌文本轉圖像人工智能模型 Imagen 首次公開亮相

發布時間：2022-11-03 11:38 來源：IT之家作者：遠洋

11 月 3 日消息，谷歌在發布其文本轉圖像的人工智能系統方面極為謹慎，盡管該公司的 Imagen 模型產生的輸出質量與 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相當，但谷歌此前并沒有將該系統向公眾開放。

不過今天，這家搜索巨頭宣布將把 Imagen 以非常有限的形式添加到其 AI Test Kitchen 應用中，作為一種收集關于該技術的早期反饋的方式。

AI Test Kitchen 是在今年早些時候推出的，目的是對谷歌的各種 AI 系統進行測試。目前，該應用程序提供了一些不同的方式與谷歌的文本模型 LaMDA 進行互動，該公司很快將增加類似的限制性 Imagen 請求，作為其所謂的應用程序“第二季”更新的一部分。簡而言之，將有兩種方式與 Imagen 互動：城市夢想家和 Wobble。

在“城市夢想家”中，用戶可以要求模型生成圍繞他們選擇的主題設計的城市元素，例如，南瓜、牛仔布。Imagen 創建了樣本建筑和地塊(城市廣場、公寓樓、機場等等)，所有的設計都以類似于在《模擬城市》中看到的等距模型出現。

在 Wobble 中，你可以創造一個小怪物。可以選擇它的材質(粘土、毛氈、杏仁糖、橡膠)，然后給它穿上你選擇的衣服。該模型會生成你的怪物，給它起個名字，然后你可以戳戳它，讓它“跳舞”。

與其它文本到圖像的模式相比，這些互動是非常受限制的，用戶不能隨便創造他們喜歡的東西。不過，這也是谷歌有意為之。谷歌產品管理高級總監喬希-伍德沃德(Josh Woodward)解釋稱，AI Test Kitchen 的全部意義在于：a)獲得公眾對這些 AI 系統的反饋;b)測試哪些行為會使得系統崩潰。

不過最大的問題是，谷歌是否會想把這些模型推向更廣泛的公眾，會采取什么形式?目前，該公司的競爭對手 OpenAI 和 Stability AI 正急于將文本-圖像模型商業化，谷歌是否會覺得自己的系統足夠安全，可以走出 AI Test Kitchen 提供給用戶?

更多>同類內容