اپل هوش مصنوعی متن باز OpenELM را معرفی کرد


اپل امروز چندین مدل زبانی بزرگ (LLM) منبع باز را منتشر کرده است که به‌جای پردازش ازطریق سرورهای ابری، کاملاً بر روی دستگاه (on-device) اجرا شوند. مدل زبانی جدید اپل که OpenELM (مدل‌های زبانی کارآمد منبع باز) نامیده می‌شود، در Hugging Face Hub، انجمنی برای اشتراک‌گذاری کدهای هوش مصنوعی، در دسترس هستند.

هوش مصنوعی متن باز OpenELM اپل

همان‌طور که در یک صفحه PDF ذکر شده است، درمجموع هشت مدل OpenELM وجود دارد که چهار مدل از آن‌ها با استفاده از کتابخانه CoreNet از قبل آموزش داده شده‌اند و چهار مدل نیز تنظیم‌شده با دستورالعمل هستند. اپل از یک استراتژی مقیاس‌بندی لایه‌ای استفاده می‌کند که هدف آن بهبود دقت و کارایی است.

اپل کد، گزارش‌های آموزشی و نسخه‌های متعدد را به‌جای مدل آموزش‌دیده نهایی ارائه کرده است و محققان امیدوارند که این پروژه منجر به پیشرفت سریع‌تر و نتایج قابل‌اعتمادتر در زمینه هوش مصنوعی با زبان طبیعی شود.

«OpenELM یک مدل زبانی باز پیشرفته است. این مدل از یک استراتژی مقیاس‌بندی لایه‌ای برای تخصیص مؤثر پارامترها در هر لایه از مدل ترانسفورماتور استفاده می‌کند که منجر به افزایش دقت می‌شود. به‌عنوان‌مثال، با بودجه پارامتری تقریباً یک میلیارد، OpenELM در مقایسه با OLMo تا 2.36 درصد بهبود در دقت نشان می‌دهد درحالی‌که به 2 برابر توکن‌های کمتر قبل از آموزش نیاز دارد.

     با انحراف از رویه‌های قبلی که فقط وزن مدل و کد استنتاج ارائه می‌کنند، نسخه جدید شامل چارچوب کاملی برای آموزش و ارزیابی مدل زبانی درمجموعه داده‌های در دسترس عموم است.»

هوش مصنوعی متن باز OpenELM اپل

هوش مصنوعی متن باز OpenELM اپل

اپل می‌گوید که مدل‌های OpenELM را برای «توانمندسازی و غنی‌سازی جامعه تحقیقات باز» با مدل‌های زبانی پیشرفته منتشر می‌کند. به اشتراک‌گذاری مدل‌های منبع باز به محققان راهی برای بررسی ریسک‌ها و داده‌ها و سوگیری‌های مدل می‌دهد. توسعه‌دهندگان و شرکت‌ها می‌توانند از مدل‌ها همان‌طور که ارائه شده‌اند، استفاده کرده یا تغییراتی را در آن‌ها ایجاد کنند.

به‌اشتراک‌گذاری آزاد اطلاعات به ابزار مهمی برای اپل برای جذب مهندسان، دانشمندان و کارشناسان برتر تبدیل شده است، زیرا فرصت‌هایی را برای مقالات تحقیقاتی فراهم می‌کند که به‌طور معمول تحت سیاست‌های محرمانه اپل نمی‌توانستند منتشر شوند.

اپل هنوز این نوع قابلیت‌های هوش مصنوعی را به دستگاه‌های خود نیاورده است، اما انتظار می‌رود iOS 18 دارای تعدادی ویژگی جدید هوش مصنوعی باشد و شایعات حاکی از آن است که اپل درحال برنامه‌ریزی برای اجرای مدل‌های زبانی بزرگ خود بر روی دستگاه برای حفظ حریم خصوصی است.

نظر شما درباره هوش مصنوعی متن باز OpenELM اپل چیست؟



منبع