Cara Menggunakan Model VOID bagi Pembuat Film Independen yang Tidak Bisa Kembali ke Lokasi Syuting
30 avril 2026
0
Computing/SoftwareComments (0)
Log in to leave a comment
No posts yet
Log in to leave a comment
No posts yet
Model VOID yang dirilis oleh tim peneliti Netflix bukan sekadar alat untuk menghapus orang. Model ini menghitung hubungan kausalitas fisik tentang bagaimana objek yang tersisa harus bergerak sesuai gravitasi di tempat objek yang hilang tersebut. Di lokasi syuting film independen di mana aktor utama tiba-tiba mengundurkan diri atau terjadi masalah hak cipta namun tidak ada dana untuk syuting ulang, teknologi ini secara harfiah adalah penyelamat.
Model VOID memakan memori dalam jumlah besar karena harus menjaga kontinuitas antar bingkai (frame) video. VRAM 24GB dari RTX 4090 yang digunakan di rumah tidak akan cukup. Diperlukan setidaknya 40GB atau lebih, jadi daripada membeli workstation seharga puluhan ribu dolar, Anda harus menyewa instans di RunPod atau Lambda Labs. Hingga tahun 2026, model H100 PCIe dapat disewa dengan harga sekitar 2 dolar per jam. Terlihat mahal, tetapi dibandingkan dengan biaya syuting ulang, ini hampir seperti gratis.
Pengaturannya selesai dalam 30 menit. Pilih templat yang menyertakan PyTorch 2.2.0 dan CUDA 12.1 di dasbor RunPod untuk membuat instans. Jalankan apt-get install ffmpeg di terminal, kloning repositori resmi, lalu instal dependensi, dan Anda siap. Pastikan untuk mengunggah file bobot (weights) ke volume jaringan. Anda harus menghemat waktu dan biaya yang dihabiskan untuk mengunduh ulang data berukuran gigabyte setiap kali menyalakan atau mematikan instans.
Rotoscoping, atau membuat garis luar secara manual satu per satu, adalah neraka. Model VOID menggunakan struktur quad mask 4 tahap yang membagi nilai dari 0 (target penghapusan) hingga 255 (latar belakang), dan Anda tidak perlu menggambarnya secara manual. Dengan mengekstrak data Magic Mask dari DaVinci Resolve dan menjalankan skrip konversi, 80% waktu kerja akan terpangkas.
Di DaVinci Resolve, mask objek utama dan objek yang terpengaruh pada node terpisah, lalu ekspor sebagai urutan PNG. Kemudian gunakan skrip FFmpeg untuk menetapkan mask objek utama sebagai hitam (0) dan mask area pengaruh sebagai abu-abu (127). Terapkan filter abu-abu tua (63) pada batas di mana kedua area tumpang tindih untuk menggabungkan video quad mask akhir. Dengan cara ini, AI akan secara otomatis menggambar lintasan cangkir yang dipegang karakter saat jatuh ke lantai setelah karakter tersebut dihapus.
Hasil inpainting terkadang menjadi masalah karena terlalu bersih. Jika area sekitar memiliki nuansa film yang kasar tetapi bagian yang dihapus mulus seperti hasil Photoshop, penonton akan segera menyadarinya. Meskipun sistem 2-pass VOID meminimalkan guncangan, sistem ini tidak mereplikasi partikel noise dari video asli.
Ketimpangan ini diatasi dengan mengambil profil noise dari bagian video asli yang bersih. Buka node Film Grain di DaVinci Resolve dan analisis ukuran partikel dari sumber asli. Kemudian, tempelkan grain buatan dengan nilai pengaturan yang sama sebagai overlay hanya pada area mask. Gunakan Luma Key untuk mengatur agar grain lebih terlihat pada nada menengah (mid-tones), sehingga batas antara area yang dibuat AI dan rekaman asli menghilang sepenuhnya.
Jika latar belakang rumit, AI terkadang membuat kesalahan dengan mengaburkan bentuk objek. Dalam kasus ini, jangan percaya sepenuhnya pada output VOID sebagai jawaban mutlak, melainkan gunakan strategi hibrida dengan mencampurkan Stable Diffusion (SDXL).
Ekstrak hanya frame yang mengalami kesalahan parah dan buat gambar diam (still cut) yang benar dengan pencahayaan latar belakang yang disesuaikan menggunakan SDXL. Masukkan gambar yang telah diperbaiki ini ke dalam alat seperti EbSynth untuk menerapkan tekstur ke seluruh urutan sesuai dengan vektor gerakan video. Terakhir, gunakan teknologi RIFE untuk interpolasi frame agar gerakan yang sebelumnya terputus-putus menjadi terhubung dengan mulus. Meskipun ini adalah proses penanganan manual terhadap kekacauan yang dibuat AI, hasilnya akan memiliki stabilitas tingkat produksi.
Biaya cloud dihitung per detik. Menjalankan rendering 4K secara sembarangan adalah pemborosan anggaran. Pertama-tama, gunakan Spot Instance dari RunPod. Meskipun bisa dimatikan kapan saja, harganya 70% lebih murah daripada On-demand.
Sebelum melakukan pekerjaan yang sebenarnya, jalankan inferensi 1-pass dengan resolusi rendah 480p terlebih dahulu. Buat daftar periksa untuk memastikan apakah batas objek yang dihapus bocor atau apakah gerakan benda-benda di sekitarnya masuk akal secara fisik. Hanya ketika hasil tes sudah pasti, tingkatkan output H100 yang mahal ke maksimal untuk menjalankan rendering resolusi tinggi akhir. Teknologi yang tidak mempertimbangkan efisiensi hanyalah kemewahan bagi pembuat film independen.