عرضه جدیدترین مدل هوش مصنوعی متا
تاریخ انتشار: ۲۷ خرداد ۱۴۰۲ | کد خبر: ۳۸۰۰۱۸۷۷
به گزارش خبرنگار گروه ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده میدهد برای تبدیل متن به گفتار همان کاری را انجام میدهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپهای صوتی را پخش میکند. متا این سیستم را این گونه تعریف میکند: «یک مدل هماهنگساز جریان بهصورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته و متا بهطور خاص از صدای کتابهای صوتی به زبانهای انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی استفاده کرده است. متا میگوید مدل آنها عملاً میتواند هر متنی را از یک زبان به یک زبان دیگر ترجمه کند و شکل گفتاری زبان مقصد را حفظ کند.
نتایج نشان میدهد که مدلهای تشخیص گفتار آموزش دیده در گفتار مصنوعی تولید شده توسط «ویس باکس» (Voicebox) تقریبا به خوبی مدلهای آموزش دیده در گفتار واقعی عمل میکنند.
**«ویس باکس» چه قابلیتهایی دارد؟
محققان متا توضیح دادند: این سیستم ابتدا پیش بینی بخشهای گفتار براساس محیط اطراف آن و سپس متن به متن را آموزش داده شده است این مدل پس از یادگیری گفتار از متن، میتواند این کار را در وظایف تولید گفتار، از جمله تولید بخشهایی در وسط یک ضبط صوتی به کار گیرد.
گفته میشود که «ویس باکس» همچنین قادر به ویرایش فعال کلیپهای صوتی، حذف نویز از گفتار و حتی جایگزینی کلمات نادرست است. به گفته محققان، یک فرد میتواند تشخیص دهد که کدام بخش گفتار توسط نویز خراب شده است آن را برش بزند و به مدل دستور دهد تا آن بخش را بازسازی کند.
بااینحال، مدل «ویسباکس» یا کد منبع آن در اختیار عموم قرار نمیگیرد. متا اذعان کرده است که با توجه به ریسکهای احتمالی فعلاً قصدی برای عرضه عمومی این مدل ندارد.
آنها درحالحاضرصرفاً مقاله تحقیقاتی مقدماتی این مدل را منتشر کردهاند، اما امیدوارند که در آینده بتوانند از این فناوری برای کمک به افرادی که تارهای صوتیشان دچار مشکل شده است، و یا به عنوان دستیارهای صوتی استفاده کنند.
انتهای پیام/
منبع: آنا
کلیدواژه: هوش مصنوعی گفتار مصنوعی متا
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت ana.press دریافت کردهاست، لذا منبع این خبر، وبسایت «آنا» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۰۰۱۸۷۷ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
جدیدترین موضع گیری حماس درباره مذاکرات آتش بس
به گزارش خبرگزاری مهر به نقل از خبرگزاری شهاب، طاهر النونو مشاور رئیس دفتر سیاسی حماس به روند جاری مربوط به مذاکرات توافق آتش بس غزه واکنش نشان داد.
وی افزود: هرگونه توافقی باید دربرگیرنده برقراری آتش بس، خروج نظامیان صهیونیست و شروع بازسازی غزه باشد.
النونو بیان کرد: افزوده شدن کشورهای ترکیه و روسیه به کشورهای ضامن توافق نکته بسیار مهمی است.
این در حالی است که مقامات صهیونیست مدعی شدند: نمی خواهیم که قبل از هرگونه نرمش حماس هیاتی بفرستیم.
گفتنی است که دقایقی قبل برخی منابع از پیشرفته های حاصل شده در روند مذاکرات مربوط به آتش بس خبر داده بودند.
کد خبر 6096498