[ad_1]
NVIDIA ve Stanford Üniversitesi’nden araştırmacılar, Test-Time Training (TTT) adında yeni bir AI modeli tanıttı.
Geliştiriciler, bu modeli “Tom ve Jerry” çizgi filmlerinin 50 saatlik görüntüsü üzerinde eğitti ve sonuç olarak model, metin tabanlı bir sorguya yanıt olarak, bir dakikaya kadar yeni çizgi film bölümleri üretebilme yeteneği kazandı. Geliştiriciler, modelin ürettiği videolardan bazı örnek talepleri ve bu taleplere karşılık gelen videoları gösterdi.
Metin tabanlı sorgu:
Tom, New York’taki bir ofise gelir. Jerry, onun bilgisayarının kablosunu kemirir. Tom onun peşinden koşar, bir duvara çarpar ve Jerry saklanır. Tom, bir toplantıyı yönetmekte olan bulldog Spike’ın bulunduğu odaya girer, toplantıyı böler.
Metin tabanlı sorgu:
Jerry peynir yer, Tom onu alır ve fareyle alay eder. Jerry eşyalarını toplayıp evden ayrılır. Tom üzülür ve onun peşinden San Francisco’ya kadar gider. Buluşmalarında, fareye özür olarak peynir verir.
Modelin bir geliştiricisi olan Karan Dalal, videoların işlenmediğini belirtti; videolarda hala artifaktlar bulunuyor, ancak videoları yaratmak için sadece 5 milyar parametre kullanılan bir model kullanıldı. Geliştiriciler, daha karmaşık bir model için gerekli donanıma sahip olduklarında, daha uzun ve daha tutarlı videolar üretebilecekler.
