Google DeepMind har återigen visat sin framstående position inom AI-forskning med lanseringen av Genie 2, en avancerad världmodell som kan skapa spelbara, actionkontrollerade 3D-miljöer från en enda bild. Detta är inte bara en teknikdemonstration; det är ett steg mot en framtid där AI kan bygga hela världar för oss att utforska och interagera med.
Genie 2 är en så kallad "foundation world model", vilket betyder att den är tränad för att förstå och generera komplexa, interaktiva miljöer. Här är vad som gör Genie 2 unik:
- Från Bild till Värld: Med bara en bild som prompt kan Genie 2 skapa en 3D-miljö där du kan utforska, interagera och till och med spela spel. Detta öppnar upp för kreativa möjligheter i spelutveckling, utbildning och även i designprocesser.
- Fysik och Interaktion: Modellen har lärt sig att simulera fysik, vilket innebär att världarna den skapar inkluderar realistiska interaktioner, som att hoppa, simma, eller använda verktyg i en spelbar miljö.
- Memory och Consistency: Genie 2 kan komma ihåg delar av världen som inte är i sikt och återge dem korrekt, vilket gör upplevelsen mer sammanhängande och realistisk.
- Vidareutveckling av Genie: Den första Genie-modellen visade potentialen för att generera spelbara miljöer från internetvideo, men Genie 2 tar detta till en ny nivå genom att integrera dessa miljöer med mer komplexa interaktioner och högre visuell kvalitet.
Denna modell har potential att förändra hur vi tränar mer allmänna AI-agenter, erbjuda en oändlig mängd träningsmiljöer, och kanske till och med påverka hur vi lär oss och leker med teknik i framtiden. Det är en viktig utveckling inom AI-forskning eftersom det visar att vi kan skapa interaktiva miljöer på ett sätt som tidigare varit omöjligt utan enorma mängder manuellt arbete.
Genie 2 från Google DeepMind är mer än bara ett nytt verktyg; det är en inblick i vad som är möjligt när AI börjar skapa världar. För att förstå mer om hur Genie 2 kan förändra vår interaktion med digitala miljöer, besök DeepMinds blogg om Genie 2.