هوش مصنوعی گوگل حالا می‌تواند صدای شما را بشنود

به گزارش اقتصادآنلاین به نقل از زومیت، هوش مصنوعی Gemini ۱.۵ Pro به‌لطف آپدیت جدید گوگل می‌تواند به فایل‌های صوتی آپلودشده گوش دهد و اطلاعات را از تماس‌های دریافتی یا صدای ویدئوها بدون نیاز به دستورهای متنی استخراج کند.

در رویداد Cloud Next، گوگل اعلام کرد که مدل زبانی بزرگ جمنای ۱٫۵ پرو را برای اولین‌بار ازطریق ابزار Vertex AI دردسترس عموم ازجمله توسعه‌دهندگان قرار می‌دهد.

درحال‌حاضر، نسخه‌ی جدید جمنای پرو ازنظر عملکرد، از بزرگ‌ترین و قدرتمندترین مدل جمنای، یعنی اولترا ۱٫۰، پیشی گرفته است. گوگل ادعا می‌کند که جمنای ۱٫۵ پرو می‌تواند دستورالعمل‌های پیچیده را درک کند.

Gemini ۱.۵ Pro برای افرادی کاربردی نیست که به Vertex AI دسترسی ندارند. ناگفته نماند که جمنای اولترا به چت‌بات پیشرفته‌ی جمنای قدرت می‌دهد. این مدل زبانی بزرگ قدرتمند است و می‌تواند دستورهای متنی طولانی را درک کند؛ اما سرعت جمنای ۱٫۵ پرو را ندارد.

جمنای ۱٫۵ پرو، تنها مدل زبانی بزرگ گوگل نیست که به‌روزرسانی می‌شود. Imagen ۲ ابزار تولید متن به تصویر است که به توانمندسازی قابلیت‌های تولید تصویر جمنای کمک می‌کند. این ابزار در آپدیت جدیدش به کاربران اجازه می‌دهد تا سوژه‌ها را به تصویر اضافه یا از آن‌ حذف کنند. گوگل نیز قابلیت واترمارک دیجیتال SynthID خود را در تمامی تصاویر ایجادشده با مدل‌های Imagen دردسترس قرار داده است.

گوگل در حال آزمایش ویژگی پاسخ هوش مصنوعی در صفحه‌ی نتایج اصلی جست‌وجو به‌صورت عمومی است و کاربران بدون نیاز به عضویت در Search Labs می‌توانند پاسخ هوش مصنوعی را مشاهده کنند.

این خبر را در تهران اقتصادی دنبال کنید .

منبع اقتصاد آنلاین

برچسب ها