• امروز : پنج شنبه - ۹ بهمن - ۱۴۰۴
  • برابر با : Thursday - 29 January - 2026
7

ChatGPT می تواند صحبت کند، گوش دهد و تصاویر را پردازش کند!

  • کد خبر : 8675
  • 04 مهر 1402 - 13:38
ChatGPT می تواند صحبت کند، گوش دهد و تصاویر را پردازش کند!
به روز رسانی چت بات، به کاربران این امکان را می دهد تا مکالمات صوتی را در برنامه تلفن همراه ChatGPT انتخاب کنند و از پنج صدای مصنوعی مختلف برای پاسخگویی ربات استفاده کنند. همچنین، کاربران می‌توانند تصاویر را با چت‌جی‌پی‌تی به اشتراک بگذارند و نقاط مشخصی را در تصویر مشخص کنند تا چت‌بات بتواند در مورد آن تحلیل یا توضیحاتی ارائه دهد.

به گزارش سرویس بین الملل پایگاه خبری عدل البرز به نقل از  CNBC این شرکت اعلام کرد که در حال حاضر،  ChatGPT  می تواند صحبت کند، ببیند ، بشنود یا حداقل کلمات گفته شده را متوجه شود، با صدای مصنوعی پاسخ دهد و تصاویر را پردازش کند.

ChatGPT می تواند صحبت کند

به روز رسانی چت بات، به کاربران این امکان را می دهد تا مکالمات صوتی را در برنامه تلفن همراه ChatGPT انتخاب کنند و از پنج صدای مصنوعی مختلف برای پاسخگویی ربات استفاده کنند.  همچنین، کاربران می‌توانند تصاویر را با چت‌جی‌پی‌تی به اشتراک بگذارند و نقاط مشخصی را در تصویر مشخص کنند تا چت‌بات بتواند در مورد آن تحلیل یا توضیحاتی ارائه دهد.

OpenAI گفت که تغییرات در دو هفته آینده برای کاربرانی که پرداختی انجام داده اند، اعمال خواهد شد. با اینکه عملکرد صوتی در برنامه‌های iOS و اندروید محدود می باشد اما قابلیت‌های پردازش تصویر در همه پلتفرم‌ها در دسترس خواهد بود.

بدین ترتیب، رقابت‌ مربوط به برنامه‌ریزی هوش مصنوعی بین رهبران چت‌بات‌ها مانند  OpenAI، مایکروسافت، گوگل و آنتروپیک بیشتر می شود. به منظور تشویق مصرف‌کنندگان به بهره‌برداری از هوش مصنوعی مولد در زندگی روزمره شان، شرکت‌های فناوری به رقابت برای عرضه برنامه‌های جدید چت‌بات و همچنین افزونه‌های جدید، پرداخته اند. گوگل اقدام به اعلام مجموعه‌ای از به‌روزرسانی‌ها برای چت‌بات Bard خود کرده است، و مایکروسافت قابلیت جستجوی تصاویر را به موتور جستجوی بینگ اضافه کرده است.

در ابتدای سال جاری، مایکروسافت سرمایه‌گذاری به مبلغ ۱۰ میلیارد دلار بر روی OpenAI انجام داده که در واقع،  بزرگترین سرمایه‌گذاری در حوزه هوش مصنوعی در سال می باشد. در ماه آوریل، گزارش شده که OpenAI فروش سهام به ارزش ۳۰۰ میلیون دلار را با ارزشی بین ۲۷ تا ۲۹ میلیارد دلار انجام داده است. این سرمایه‌گذاری شامل شرکت‌هایی نظیر Sequoia Capital و Andreessen Horowitz  هم بوده است.

کارشناسان نگرانی‌ها در مورد صداهای مصنوعی تولید شده توسط هوش مصنوعی را بیان کرده‌اند. در این حالت، این صداها ممکن است به کاربران تجربه‌ طبیعی‌تری ارائه دهند، اما همچنین می‌توانند امکان ایجاد دیپ فیک های باورپذیرتری را هم فراهم کنند. عوامل تهدیدات سایبری و پژوهشگران در حال حاضر قصد دارند بررسی کنند که چگونه از دیپ فیک ها می‌توانند برای نفوذ به سیستم‌های امنیت سایبری استفاده شوند.

با توجه به این نگرانی ها، اوپن‌ای‌آی اعلام کرد، برای ساخت صداهای مصنوعی در این نسخه از چت‌جی‌پی‌تی، از هنرپیشگانی استفاده شده که با آن‌ها همکاری مستقیم داشته‌اند و صداهای ناشناخته استفاده نشده است. این فرایند می‌تواند به کاهش نگرانی‌های مرتبط با، استفاده از صداهای مصنوعی در زمینه‌هایی مانند دیپ فیک کمک کند.

معرفی نسخه جدید همچنین اطلاعات محدودی در مورد نحوه استفاده اوپن‌ای‌آی از ورودی‌های صوتی مشتریان و نحوه امنیت داده‌ها ارائه داده است. شرایط خدمات شرکت اعلام می‌کند، در مواردی که قوانین و مقررات مربوطه اجازه دهد، مشتریان مالکیت کامل بر ورودی‌های خود دارند.

OpenAI اعلام کرده که در مورد تعاملات صوتی، طبق راهنمایی‌های شرکت، فایل‌های صوتی را نگه نمی‌دارد و از آنها برای بهبود مدل‌ها استفاده نمی‌کند.

این  شرکت همچنین به این نکته اشاره می‌کند که (متن‌های نوشتاری) به عنوان ورودی‌ها در نظر گرفته می‌شوند و ممکن است برای بهبود مدل‌های زبان بزرگ مورد استفاده قرار بگیرند.

پایان پیام/

لینک کوتاه : https://adlealborz.ir/?p=8675

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : 0
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.