به گزارش سرویس بین الملل پایگاه خبری عدل البرز به نقل از cybernews.com ، برای اینکه یک سیستم هوش مصنوعی به طور کامل از تمام صنایع، فرهنگها و زبانها درک کامل داشته باشد، نیاز به داشتن یک مجموعه داده آموزشی با گستردگی حداکثری دارد. به عبارت دیگر، برنامههای هوش مصنوعی برای داشتن درک جامع و گسترده نیازمند دسترسی به دادههای آموزشی از انواع و اقسام مختلف صنایع، فرهنگها و زبانها هستند.
فناوری هوش مصنوعی مدرن مهارت ها و جوانب مختلف جهان ما را یاد میگیرد. این موارد شامل اطلاعات مربوط به افراد، انگیزهها، تعاملات، و نحوه ارتباطات ما می باشد. این یادگیری از طریق تحلیل دادههایی صورت میگیرد که به مدلهای هوش مصنوعی آموزش داده شدهاند.
OpenAI از سازمانها یا افراد دعوت میکند که مجموعهدادههای بزرگی که تصویری از جامعه انسانی ارائه میدهند و به راحتی برای عموم در دسترس نیستند را به اشتراک بگذارند. این مجموعهدادهها به صورت متنباز در دسترس عموم برای آموزش مدلهای هوش مصنوعی خواهند بود و همچنین میتوانند برای آموزش مدلهای خصوصی هوش مصنوعی استفاده شوند.
داده های ارسالی می تواند در قالب متنی، تصویری، صوتی یا تصویری باشد. این شرکت اعلام کرده که ابزارهایی برای رونویسی و دیجیتالی کردن فایل های PDF یا روش های دیگری برای پردازش داده های خام در اختیار دارد.
OpenAI مدعی ست که آنها به دنبال مجموعه داده هایی با اطلاعات حساس یا شخصی یا اطلاعات متعلق به شخص ثالث نمی باشند و می توانند به حذف این اطلاعات در داده های ارسالی کمک کنند.
افزایش تنوع و گستردگی دادههای آموزشی ممکن است باعث بهبود توانایی مدلها در درک مسائل و مفاهیم مرتبط با آن حوزه یا موضوع شود.
شرکت OpenAI با شرکای مختلف همکاری دارد و آنها تمایل دارند تا اطلاعات مربوط به کشور یا صنعت خود را در اختیار این شرکت قرار دهند.
OpenAI با دولت ایسلند و شرکت Miðeind ehf همکاری کرده تا با ادغام مجموعهدادههای انتخابی آنها، توانمندی GPT-4 در زبان ایسلندی را افزایش دهد.
علاوه بر این OpenAI با یک سازمان غیرانتفاعی به نام Free Law Project همکاری کرده و از مجموعه گسترده اسناد حقوقی این سازمان برای آموزش مدلهای هوش مصنوعی استفاده کرده است. این همکاری به منظور دسترسی عموم به دانش حقوقی هدفمندتر انجام شده است.
پایان پیام/
بیشتر بخوانید: استفاده از آثار هنری برای آموزش مدل های هوش مصنوعی