①空間智能技術,旨在讓機器理解并應對三維的真實物理環(huán)境; ②World Labs的投資者包括a16z、Adobe、AMD、Databricks、英偉達等; ③空間智能技術的應用領域包括電影、游戲等內容創(chuàng)作,以及AR/VR應用場景。
《科創(chuàng)板日報》12月3日訊(編輯 宋子喬) 當?shù)貢r間12月3日,“AI教母”李飛飛聯(lián)合創(chuàng)辦的空間智能初創(chuàng)企業(yè)World Labs(世界實驗室)展示首個成果——一張圖、一句話就能生成3D世界的AI系統(tǒng),堪稱“虛擬世界生成器”。World labs將其稱為邁向空間智能的第一步。
其亮點在于:直接生成3D場景,且場景具有交互性、可編輯、可擴圖。
交互性:用戶可以通過W/A/S/D鍵來控制上下左右視角,或者用鼠標拖動畫面探索所生成的世界,不過目前的可移動范圍仍然受限于較小的區(qū)域。
可編輯:該工具配備了可控的攝像機效果和可調節(jié)的模擬景深,用戶可改變其中物體顏色、動態(tài)調整背景光影、手動變焦、調節(jié)景深、在場景中插入其他對象、添加動畫效果。
可擴圖:這指該AI工具的可預測3D場景能力,可預測3D場景是利用AI技術對3D空間中的物體、環(huán)境結構及其動態(tài)變化進行預測和理解的能力,即讓AI工具僅憑部分圖片就能“擴圖”,想象出整個3D場景。
將梵高、霍珀、修拉和康定斯基等作家的知名畫作中的場景擴展
其中,可預測3D場景,是將World Labs與其他致力于3D內容生成的AI公司區(qū)別開的主要能力,World Labs表示,大多數(shù)生成模型都會預測像素,而預測 3D 場景有許多好處:
持久現(xiàn)實:3D場景一旦生成,它就會一直存在。即使你把視線移開然后又回來,場景也不會改變。
實時控制:3D場景生成后,用戶可以在其中實時移動。你可以仔細觀察花朵的細節(jié),也可以窺視藏在角落里的物體。
正確的幾何形狀:生成的世界遵循 3D 幾何的基本物理規(guī)則。它們兼具真實感和深度感,與某些AI生成視頻的夢幻感形成了鮮明對比。
空間智能 AI領域的下一個“北極星”
李飛飛對空間智能的定義是:空間智能是機器在3D空間和時間中感知、推理和行動的能力。在她看來,空間智能是AI領域的下一個前沿技術方向。
今年9月份,在成功融資2.3億美元后,由著名計算機科學家、斯坦福大學人工智能實驗室聯(lián)合主任、斯坦福大學教授李飛飛聯(lián)合創(chuàng)辦的World Labs正式啟動。據(jù)介紹,World Labs的目標是開發(fā)一種能夠理解實體世界的模型。今年7月,有消息稱在完成兩輪融資后,World Labs的估值已超過10億美元,該公司的投資機構可以說是耳熟能詳,包括安德森?霍羅威茨(Andreessen Horowitz,又名a16z)、Adobe、AMD、Databricks、英偉達、AI基金Radical Ventures等。
同月,在接受a16z的訪談時,李飛飛表示,空間智能是她的下一個北極星,該技術將改變AI的發(fā)展進程。她認為,空間智能與語言智能一樣重要,甚至在某些方面可能更古老、更基礎,AI的發(fā)展不會局限于處理平面圖像或文本,而是會邁向對三維世界的理解,這是智能發(fā)展的自然延伸。
電影、游戲等內容創(chuàng)作將是空間智能技術的重要應用領域,該技術有望降低3D內容制作的成本、激發(fā)更多的沉浸式體驗。World Labs的目標客戶便包括視頻游戲開發(fā)商和電影制片廠。除了互動場景之外,World Labs還計劃開發(fā)一些對藝術家、設計師、開發(fā)人員、電影制作人和工程師等專業(yè)人士有用的工具。
李飛飛還補充了增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)的應用場景。她曾提到:“這種技術將成為AR/VR的‘操作系統(tǒng)’,幫助人類增強能力?!彼e例說,未來,佩戴AR眼鏡的人可能不需要任何專業(yè)技能,就能修理汽車或完成復雜的操作。通過空間智能,虛擬世界與現(xiàn)實世界的融合將大大增強人類與機器的互動能力。
李飛飛的博士生、World Labs聯(lián)合創(chuàng)始人賈斯汀?約翰遜則指出,隨著這項技術的成熟,未來我們可能不再需要使用手機、平板等不同尺寸的屏幕。他表示:“如果你能夠將虛擬內容與物理世界無縫融合,那么對所有這些屏幕的需求就會減少。”