هوش مصنوعی Veo 2 گوگل برای رقابت با Sora و تولید ویدیوهایی با فیزیک بهتر معرفی شد
گوگل از نسخهی پیشنمایش مدل هوش مصنوعی Veo 2 پرده برداشت. گوگل میگوید Veo 2 «با زبان فیلمسازی آشنا است.» بدین معنی که کاربر میتواند هنگام کار با مدل، درخواستهایی با ارجاع به یک ژانر مشخص سینمایی، تکنیکهای فیلمبرداری یا حتی نوع لنز دوربین ارائه دهد.
گوگل میگوید که Veo 2، درک پیشرفتهتری از فیزیک دنیای واقعی و حرکات انسانی دارد. بازآفرینی دقیق حرکات انسان، چالشی همیشگی برای تمامی مدلهای هوش مصنوعی به شمار میرود و ادعای گوگل مبنیبر بهبود عملکرد Veo 2 در این دو جنبه، بسیار قابل توجه است.
نمونههای ارائهشده، برای ارزیابی دقیق و قطعی عملکرد Veo 2 کافی نیستند. آزمون واقعی قابلیتهای Veo 2 زمانی مشخص خواهد شد که از آن برای تولید ویدیویی از اجرای حرکات یک ژیمناست درخواست شود. در نهایت، گوگل تصریح کرده است که Veo خطاهایی نظیر ایجاد انگشتان اضافی را که معمولاً در مدلهای تولید ویدیو مشاهده میشود، «بسیار کمتر» تکرار خواهد کرد.
از سوی دیگر، گوگل در حال بهبود مدل Imagen 3 است. طبق گفتهی غول جستوجو، جدیدترین نسخه از مدل تبدیل متن به تصویرش، تصاویری روشنتر و با ترکیببندی بهتری تولید میکند. Imagen 3 میتواند سبکهای هنری متنوعتری را با دقت بالاتری بازآفرینی کند و در پیروی دقیقتر از دستورات عملکرد بهتری دارد.
Veo 2 بهتدریج برای کاربران Google Labs در ایالات متحده منتشر خواهد شد. در حال حاضر، گوگل، آزمایشکنندگان را به تولید حداکثر هشت ثانیه فیلم با وضوح ۷۲۰p محدود میکند. برای مقایسه، Sora میتواند تا ۲۰ ثانیه فیلم با وضوح ۱۰۸۰p تولید کند، اگرچه انجام این کار نیاز به اشتراک ماهانهی ۲۰۰ دلاری ChatGPT Pro دارد.