Web Analytics Made Easy - Statcounter
به نقل از «ايتنا»
2024-04-27@23:33:00 GMT

شش ابزار هوش مصنوعی جذاب برای تبدیل متن به ویدیو

تاریخ انتشار: ۲ اسفند ۱۴۰۲ | کد خبر: ۳۹۷۹۸۲۷۷

شش ابزار هوش مصنوعی جذاب برای تبدیل متن به ویدیو

ایتنا - در حال حاضر چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبک‌های هنری مختلف هستند.  پس از آن که DALL-E هوش مصنوعی تبدیل متن به تصویر را تولید کرد، دیگر شرکت‌ها قدمی فراتر برداشته و شروع به ساخت مدل‌های تبدیل متن به تصویر متفاوتی کردند.
در حالی که هنوز هم ممکن است نتایج کمی ناقص به نظر برسند، اما چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبک‌های هنری مختلف هستند.

بیشتر بخوانید: اخباری که در وبسایت منتشر نمی‌شوند!



در اینجا شش مدل جدید هوش مصنوعی مناسب تبدیل متن به ویدیو را معرفی می‌کنیم.

    Sora
شرکت OpenAI خالق چت‌جی‌پی‌تی به‌تازگی "سورا"، مدل جدید تبدیل متن به ویدیو خود را به نمایش گذاشته است.
این مدل "درکی عمیق از زبان" دارد و می‌تواند "شخصیت‌های قابل قبولی را ایجاد کند که احساسات را بیان می‌کنند."


    Lumiere
گوگل هوش مصنوعی ویدیویی خود به نام Lumiere را دارد که توسط یک مدل انتشار جدید به نام Space-Time-U-Net طراحی شده است. لومیر مکان اشیاء را در یک ویدیو مشخص می‌کند و نحوه حرکت و تغییر همزمان آنها را ردیابی می‌کند.
لومیر هنوز برای کاربران عادی آماده نشده است. اما به مهارت گوگل در ایجاد نیروگاه ویدئویی هوش مصنوعی اشاره می‌کند که ممکن است از مدل‌های عمومی موجود مانند Runway و Pika پیشی بگیرد.
گوگل طی دو سال اخیر جهش فنی در بازی های ویدئویی هوش مصنوعی نیز داشته است.


    VideoPoet
VideoPoet یک مدل زبان بزرگ است که بر روی مجموعه داده عظیمی از فیلم‌ها، تصاویر، صدا و متن آموزش داده شده است. این مدل می‌تواند وظایف مختلف تولید ویدیو را انجام دهد، از تبدیل متن یا تصاویر به ویدیو گرفته تا جذاب‌تر کردن ویدیوها با سبک، رنگ‌آمیزی درونی و بیرونی ویدیو، و ویدیو به صدا.

این مدل بر اساس یک ایده ساده ساخته شده است: تبدیل هر مدل زبان خودبازگشتی به یک سیستم تولید ویدئو.
مدل‌های زبان خودبازگشتی می‌توانند متن و کد را بطور بی‌نظیری ایجاد کنند. اما وقتی نوبت به ویدیو می‌رسد، آنها به یک مانع برمی‌خورند. برای مقابله با آن، VideoPoet  از چند واسطه استفاده می‌کند که می‌تواند ویدیو، تصویر و کلیپ‌های صوتی را به زبانی که می‌فهمد تبدیل کند.


    Emu Video
مدل هوش مصنوعی متا شامل دو مرحله است. ابتدا از متن یک عکس می‌سازد. سپس، از آن متن و تصویر برای ایجاد یک ویدیوی درجه یک استفاده می‌کند.
نکته جالب اینکه 81 درصد کاربران Emu Video را به  Imagen Video Google ترجیح می‌دهند، 90 درصد آن را به PYOCO NVIDIA ترجیح می‌دهند و 96 درصد می‌گویند که بهتر از Make-A-Video خود متا است. نه فقط این، بلکه حتی گزینه‌های تجاری مانند RunwayML's Gen2 و Pika Labs را نیز شکست می‌دهد.


     Phenaki
تیم پشتیبان Phenaki Video از Mask GIT برای تولید ویدیوهای هدایت‌شده متنی در PyTorch استفاده کرد. این مدل می‌تواند ویدیوهایی با هدایت متن تولید کرده که تا مدت زمان 2 دقیقه‌ای، بسازد
Phenaki همه کاره است و برای محققان جهت آموزش متن به تصویر و متن به ویدئو باز است. آنها می‌توانند با تصاویر شروع کرده و سپس برای آموزش بدون قید و شرط روی تنظیم ویدیو تمرکز کنند.


    CogVideo
گروهی از محققان دانشگاه Tsinghua در پکن CogVideo را توسعه دادند که یک مدل تولید متن به ویدئوی از قبل آموزش دیده در مقیاس بزرگ است.
آنها این مدل را با استفاده از یک مدل از پیش آموزش داده شده متن به تصویر به نام CogView2 ساختند تا از آموخته‌های قبلی خود، استفاده کنند.

منبع: ايتنا

کلیدواژه: هوش مصنوعی متن به تصویر تبدیل متن هوش مصنوعی یک مدل

درخواست حذف خبر:

«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را به‌طور اتوماتیک از وبسایت www.itna.ir دریافت کرده‌است، لذا منبع این خبر، وبسایت «ايتنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۹۷۹۸۲۷۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتی‌که در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.

با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.

خبر بعدی:

ثبت اختراع کاربردی دانشجوی دانشگاه لرستان

ایسنا/لرستان اختراع کاربردی دانشجوی دانشکده دامپزشکی دانشگاه لرستان، مصطفی شهبازی‌پاچال، با عنوان دستگاه تلقیح مصنوعی ملکه (زنبور عسل) مجهز به سنسور بیهوشی، از سوی مرکز مالکیت معنوی سازمان ثبت اسناد و املاک کشور، ثبت شد.

مصطفی شهبازی‌پاچال ششم اردیبهشت در جمع خبرنگاران اظهار کرد: یکی از ظرفیت‌های لرستان، زنبورداری و تولید عسل است و اختراع اینجانب در راستای این ظرفیت‌ها و ارتقای تولید است.

وی با بیان اینکه نژاد زنبورهای ایرانی دارای ضعف‌هایی است وتلاشم این بوده است با این اختراع، ضعف‌ها رفع شود، گفت: نژادهای مختلف زنبور در جهان را مورد بررسی علمی و تحقیقاتی قرار دادم؛ با تلقیح مصنوعی می‌توان در نژاد مورد نظر، نقاط ضعف را برطرف کرد.

این دانشجوی دکترای دامپزشکی دانشگاه لرستان، با بیان اینکه رفتار نیش‌زنی زنبورهای بومی ایران، شدید است و این یک ضعف است و رغبت زنبوردار برای رسیدگی به کندوها، کمتر می‌شود، تصریح کرد:دستگاه اختراع شده توسط اینجانب، براساس تلقیح مصنوعی، باعث رفع این ضعف می‌شود.

شهبازی‌پاچال  ادامه داد: توانایی زنبورهای بومی برای سپری‌ کردن فصل سرد زمستان، پایین است؛ به همین علت، در فصل زمستان، زنبورداری بومی بدون تلقیح مصنوعی، بین ۴۰ تا ۵۰ درصد تلفات دارد؛ این، یک نقطه ضعف است؛ با تلقیح مصنوعی از طریق دستگاه مذکور، این ایراد رفع خواهد شد.

وی، خاطرنشان کرد: زادآوری و تولید محصولات برخی زنبورهای بومی، پایین است؛ از طریق تلقیح مصنوعی دستگاه مذکور، این ضعف هم رفع می‌شود.

این دانشجوی دکترای دامپزشکی دانشگاه لرستان گفت:اگر دستگاه به مرحله تجاری‌سازی و تولید انبوه برسد می‌توانیم صادرات هم داشته باشیم.

انتهای پیام

دیگر خبرها

  • مسدود شدن مسیر‌های انحراف در تسهیلات تولید با برات الکترونیکی
  • چگونه دانشمندان تنها در چند ساعت الماس تولید کردند
  • دانشمندان تنها در چند ساعت الماس تولید کردند
  • خاندوزی: جعبه ابزار تامین مالی برای تحقق جهش تولید آماده شد
  • راه ‌اندازی برات الکترونیک برای تامین مالی تولید
  • آمادگی هند برای تولید کتاب‌های صوتی با هوش مصنوعی
  • پهپاد‌های انتحاری «شاهد» چگونه به ابزار کارآمد روسیه در جنگ اوکراین تبدیل شدند؟
  • ضرروت ایجاد برابری بیشتر در توزیع ابزار تولید
  • ثبت اختراع کاربردی دانشجوی دانشگاه لرستان
  • پایه اصلی هر سازمانی بر دوش روابط عمومی است