兩位在人工智能領(lǐng)域具有深厚背景的華人科學(xué)家,正攜手創(chuàng)立一家專注于視覺AI技術(shù)的新公司——Elorian。這家初創(chuàng)企業(yè)旨在開發(fā)能夠同時(shí)解析文本、圖像、視頻和音頻的多模態(tài)AI模型,為行業(yè)帶來突破性創(chuàng)新。目前,該公司已啟動(dòng)種子輪融資,計(jì)劃籌集約5000萬美元資金。
聯(lián)合創(chuàng)始人戴明博(Andrew Dai)擁有劍橋大學(xué)計(jì)算機(jī)科學(xué)學(xué)士學(xué)位和愛丁堡大學(xué)機(jī)器學(xué)習(xí)博士學(xué)位。他在谷歌深耕14年,從軟件工程師逐步晉升為首席研究科學(xué)家,主導(dǎo)過Gemini大型多模態(tài)模型的數(shù)據(jù)團(tuán)隊(duì)研發(fā)工作。這位技術(shù)管理者不僅在工業(yè)級(jí)AI項(xiàng)目中發(fā)揮關(guān)鍵作用,還與全球頂尖學(xué)者合作發(fā)表多篇學(xué)術(shù)論文,積累了科研與工程轉(zhuǎn)化的雙重經(jīng)驗(yàn)。
另一位聯(lián)合創(chuàng)始人楊寅飛(Yinfei Yang)的職業(yè)生涯同樣亮眼。他曾在蘋果AI/ML部門擔(dān)任多模態(tài)研究負(fù)責(zé)人,專注視覺與語言基礎(chǔ)模型開發(fā)。此前在谷歌研究部門期間,他深耕自然語言處理、語義檢索和多模態(tài)表示學(xué)習(xí)等領(lǐng)域,其主導(dǎo)的《Scaling up visual and vision-language representation learning with noisy text supervision》論文為多模態(tài)學(xué)習(xí)提供了重要理論支撐。他在亞馬遜和Redfin擔(dān)任工程師的經(jīng)歷,使其具備從算法研究到產(chǎn)品落地的完整能力。
據(jù)知情人士透露,由前CRV合伙人Max Gazor創(chuàng)立的風(fēng)投機(jī)構(gòu)Striker Venture Partners,正與Elorian洽談?lì)I(lǐng)投事宜。這家成立于2023年10月的投資機(jī)構(gòu),由Brian Zhan聯(lián)合管理,專注于早期科技企業(yè)孵化。目前雙方已進(jìn)入深度談判階段,但具體條款尚未披露。
在技術(shù)路線方面,Elorian將突破傳統(tǒng)單模態(tài)AI的局限,構(gòu)建能綜合處理視覺、聽覺和語言信息的智能系統(tǒng)。戴明博在采訪中透露,公司不僅關(guān)注機(jī)器人應(yīng)用場(chǎng)景,更在探索醫(yī)療影像分析、智能內(nèi)容生成等多元化領(lǐng)域。盡管具體產(chǎn)品形態(tài)尚未公布,但其多模態(tài)融合的技術(shù)定位已引發(fā)行業(yè)關(guān)注。
值得注意的是,兩位創(chuàng)始人在LinkedIn平臺(tái)均將公司狀態(tài)設(shè)置為"隱身模式",戴明博的資料顯示其擔(dān)任CEO職務(wù)。這種低調(diào)策略或與初創(chuàng)企業(yè)保護(hù)技術(shù)敏感性的需求有關(guān),同時(shí)也為產(chǎn)品發(fā)布預(yù)留了懸念空間。隨著融資進(jìn)程推進(jìn),這家匯聚頂尖AI人才的新銳企業(yè),有望在多模態(tài)智能領(lǐng)域掀起新的技術(shù)浪潮。















