هوش مصنوعی Veo 2 گوگل برای رقابت با Sora و تولید ویدیوهایی با فیزیک بهتر معرفی شد

گوگل از نسخه‌ی پیش‌نمایش مدل هوش مصنوعی Veo 2 پرده برداشت. گوگل می‌گوید Veo 2 «با زبان فیلم‌سازی آشنا است.» بدین معنی که کاربر می‌تواند هنگام کار با مدل، درخواست‌هایی با ارجاع به یک ژانر مشخص سینمایی، تکنیک‌های فیلم‌برداری یا حتی نوع لنز دوربین ارائه دهد.

گوگل می‌گوید که Veo 2، درک پیشرفته‌تری از فیزیک دنیای واقعی و حرکات انسانی دارد. بازآفرینی دقیق حرکات انسان، چالشی همیشگی برای تمامی مدل‌های هوش مصنوعی به شمار می‌رود و ادعای گوگل مبنی‌بر بهبود عملکرد Veo 2 در این دو جنبه، بسیار قابل توجه است.

نمونه‌های ارائه‌شده، برای ارزیابی دقیق و قطعی عملکرد Veo 2 کافی نیستند. آزمون واقعی قابلیت‌های Veo 2 زمانی مشخص خواهد شد که از آن برای تولید ویدیویی از اجرای حرکات یک ژیمناست درخواست شود. در نهایت، گوگل تصریح کرده است که Veo خطاهایی نظیر ایجاد انگشتان اضافی را که معمولاً در مدل‌های تولید ویدیو مشاهده می‌شود، «بسیار کمتر» تکرار خواهد کرد.

از سوی دیگر، گوگل در حال بهبود مدل Imagen 3 است. طبق گفته‌ی غول جست‌وجو، جدیدترین نسخه از مدل تبدیل متن به تصویرش، تصاویری روشن‌تر و با ترکیب‌بندی بهتری تولید می‌کند. Imagen 3 می‌تواند سبک‌های هنری متنوع‌تری را با دقت بالاتری بازآفرینی کند و در پیروی دقیق‌تر از دستورات عملکرد بهتری دارد.

Veo 2 به‌تدریج برای کاربران Google Labs در ایالات متحده منتشر خواهد شد. در حال حاضر، گوگل، آزمایش‌کنندگان را به تولید حداکثر هشت ثانیه فیلم با وضوح ۷۲۰p محدود می‌کند. برای مقایسه، Sora می‌تواند تا ۲۰ ثانیه فیلم با وضوح ۱۰۸۰p تولید کند، اگرچه انجام این کار نیاز به اشتراک ماهانه‌ی ۲۰۰ دلاری ChatGPT Pro دارد.

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا