O جوجل أعلنت يوم الثلاثاء (14) عن أحدث نموذج لتوليد الفيديو، Veo، والذي يعد جزءًا من أداة VideoFX. ستسمح الميزة الجديدة بإنشاء مقاطع فيديو بناءً على المطالبات النصية وتصل كمنافس لها سورا da OpenAI.
تم الإعلان عن الأداة في بث مباشر خلال جوجل I / O 2024. بالإضافة إلى السماح بإنشاء المحتوى، ستسمح المنصة بالتفاعل مع تقنيات الشركة الأخرى، مثل أداة إنشاء الموسيقى باستخدام الذكاء الاصطناعي.
ما هو فيو
أثناء الكشف عن أحدث تقنيات الذكاء الاصطناعي التي طورتها Google لإنشاء مقاطع الفيديو، تم التأكيد على نقطة أساسية: يتجاوز Veo المدة النموذجية التي تبلغ دقيقة واحدة، ويقدم نتائج بدقة 1080 بكسل والقدرة على استكشاف مجموعة متنوعة من الأساليب السينمائية والمرئيات.
وفقًا للشركة، يتمتع هذا الذكاء الاصطناعي بمعرفة متقدمة في كل من اللغة الطبيعية والدلالات المرئية، مما يسمح بعرض أكثر دقة حتى مع الأوامر الأطول والأكثر تفصيلاً.
تدعي Google أن Veo قادر على إنشاء محتوى متسق ومتماسك، حيث يتحرك الأشخاص والحيوانات والأشياء بشكل واقعي عبر مقاطع الفيديو. علاوة على ذلك، فإن الأداة قادرة على فهم مصطلحات محددة من عالم السينما، مثل "الفاصل الزمني" و"التسجيل الجوي للمناظر الطبيعية"، وبالتالي توفير تحكم إبداعي أكبر في النتائج المرجوة.
كان العرض التقديمي للذكاء الاصطناعي الجديد موجهًا إلى مجموعة من صانعي الأفلام والمبدعين، الذين أتيحت لهم الفرصة لتجربة النموذج وتقديم تعليقات للشركة، مما يساهم في التحسينات المستقبلية المحتملة.
وأعلنت جوجل أيضًا أنه سيتم دمج بعض ميزات Veo تدريجيًا في YouTube Shorts ومنتجات الشركة الأخرى، على الرغم من عدم تحديد موعد لذلك.
فيديوفكس
VideoFX عبارة عن بوابة يتم الوصول إليها من خلال المتصفح نفسه لاستخدام Veo، وهو نموذج توليدي أنشأته الشركة للتنافس مع Sora، من OpenAI. حاليًا، المنتج الجديد متاح في مرحلة تجريبية فقط في الولايات المتحدة.
من خلال رسالة نصية أو صورة أو مقطع فيديو فقط، تسمح لك الميزات الجديدة بإنشاء وتحرير مقاطع فيديو تزيد مدتها عن 60 ثانية بأنماط مرئية مختلفة، مما يسمح للمستخدم باستكشاف الأفكار الأكثر تنوعًا.
وبحسب جوجل، توفر الأداة أيضًا بعض خيارات التحرير، مثل وضع Storyboard للعمل على المشاهد التي تم إنشاؤها، بالإضافة إلى تضمين الموسيقى والمؤثرات الصوتية.
يمكن للمقيمين في الولايات المتحدة الوصول إلى الأداة من خلال قائمة الانتظار. في الوقت الحالي، لا توجد توقعات لإطلاقه في البرازيل وبلدان أخرى.
إيماغيفكس
أعلنت Google أيضًا عن Image 3، المتوفر في ImageFX من Google Labs. باستخدامه، من الممكن إنشاء صور جديدة تمامًا بناءً على مطالبة نصية، وهو شيء مشابه جدًا لما نراه في MidJourney، على سبيل المثال.
مع الجيل الثالث، تعد Google بأن المستخدمين سيحصلون على صور مطابقة للواقع على حد سواء، وذلك بفضل التحسينات في جودة ودقة توليد الصور.
ووفقا لعملاق ماونتن فيو، فإن Imagem 3 سيكون قادرا على وضع الكلمات والعبارات في الصور، وهو الأمر الذي لا يزال يمثل بعض المشاكل على المنصات ذات المقترحات المماثلة.
Musicfx
أعلنت Google أيضًا عن أداة أخرى تعمل بالذكاء الاصطناعي لإنشاء الموسيقى، وهي MusicFX with AI Sandbox. وستتنافس الميزة الجديدة، التي تصل بالشراكة مع يوتيوب، بشكل مباشر مع شركات مثل Moises.ai، التي تستخدم الذكاء الاصطناعي لفصل المقاطع الصوتية لنفس الأغنية.
"تم تصميم هذه الأدوات لفتح ملعب جديد للإبداع، مما يسمح للأشخاص بإنشاء أقسام موسيقية جديدة من الصفر، وتحويل الصوت بطرق جديدة، وغير ذلك الكثير."، صرحت Google أثناء العرض التقديمي.
تعلمLM
أخيرًا، كشفت جوجل عن عائلتها الجديدة من نماذج الذكاء الاصطناعي المولدة للتعلم. تم تصميم LearnLM لتوجيه الطلاب بطريقة "المحادثة" عبر مجموعة متنوعة من المواضيع.
"يعتمد LearnLM على الأبحاث التعليمية، مما يجعل تجارب التعلم أكثر شخصية وجاذبية"، أوضح جيمس مانيكا، نائب الرئيس الأول للأبحاث والتكنولوجيا والمجتمع في Google Research، في Google I/O يوم الثلاثاء.
يتم تشغيل LearnLM حاليًا بواسطة ميزات عبر منتجات Google، بما في ذلك YouTube وتطبيقات Google Gemini وبحث Google وGoogle Classroom.
في تطبيقات Gemini، على سبيل المثال، سيكون من الممكن، في الأشهر المقبلة، إنشاء روبوتات دردشة مخصصة يمكنها العمل كخبراء في مواضيع مختلفة. ستوفر Chatbots التوجيه الدراسي والأنشطة العملية، مثل الاختبارات والألعاب، مع احترام التفضيلات الفردية لكل طالب.
انظر أيضا:
تعرض Google Astra، وهو منافس لـ GPT-4 الذي يرى العالم الحقيقي من خلال كاميرا الهاتف الخليوي.
مصدر: جوجل.
اكتشف المزيد عن Showmetech
قم بالتسجيل لتلقي آخر أخبارنا عبر البريد الإلكتروني.