معرفی هم‌زمان هوش مصنوعی جما ۴: کدنویس ماهر گوگل با نوآوری‌های قابل توجه

معرفی هم‌زمان هوش مصنوعی جما ۴: کدنویس ماهر گوگل با نوآوری‌های قابل توجه

گوگل از نسل جدید هوش مصنوعی خود با نام «جما ۴» رونمایی کرد؛ مجموعه‌ای از مدل‌های متنوع که با هدف تقویت پردازش محلی و کاهش وابستگی به سرویس‌های ابری توسعه یافته‌اند.

درحالی‌که مدل‌های خانواده جمنای پیشرفت‌های بزرگی تجربه کرده‌اند، محدود بودن آن‌ها به اکوسیستم گوگل استفاده‌ی گسترده را دشوار می‌کرد. جما ۴ این محدودیت را برطرف کرده و در چهار اندازه‌ی مختلف ارائه می‌شود تا بتوان آن را روی انواع سخت‌افزارهای شخصی اجرا کرد.

قدرت بیشتر، دسترسی آسان‌تر

دو مدل بزرگ‌تر این خانواده، یعنی 26B Mixture of Experts و 31B Dense (با ۲۶ و ۳۱ میلیارد پارامتر)، قادرند بدون نیاز به کوانتیزه‌سازی و با فرمت bfloat16 روی کارت‌های گرافیک H100 با حافظه ۸۰ گیگابایتی اجرا شوند. هرچند این کارت‌ها قیمت بالایی دارند، اما امکان اجرای کاملاً محلی مدل را فراهم می‌کنند. همچنین با کاهش دقت و اعمال کوانتیزه‌سازی، اجرای این مدل‌ها روی GPUهای گیمینگ و ارزان‌تر نیز ممکن می‌شود.

تمرکز اصلی گوگل در جما ۴ کاهش تأخیر و بهبود عملکرد پردازش آفلاین بوده است. در مدل 26B Mixture of Experts هنگام استنتاج تنها ۳.۸ میلیارد پارامتر فعال می‌شود که سرعت را به‌طور قابل توجهی افزایش می‌دهد. مدل 31B Dense بیشتر روی ارائه‌ی کیفیت بالاتر متمرکز است و گوگل انتظار دارد توسعه‌دهندگان آن را برای نیازهای تخصصی خود سفارشی‌سازی کنند.

مدل‌های سبک «نانو» برای گوشی‌ها

گوگل دو مدل سبک‌تر جما ۴ با نام‌های Effective 2B (E2B) و Effective 4B (E4B) را معرفی کرده که به‌طور ویژه برای اجرا روی گوشی‌های هوشمند طراحی شده‌اند. تمرکز اصلی این مدل‌ها کاهش مصرف رم در زمان استنتاج است و به‌ترتیب ۲ و ۴ میلیارد پارامتر مؤثر را پردازش می‌کنند.

تیم پیکسل گوگل با همکاری کوالکام و مدیاتک این مدل‌ها را برای دستگاه‌هایی مانند گوشی‌های موبایل، Raspberry Pi و جتسون نانو بهینه کرده است. نسل جدید نسبت به جما ۳ انرژی کمتر مصرف می‌کند، رم کمتری نیاز دارد و با «تأخیر تقریباً صفر» کار می‌کند.

بهبودهای چشمگیر نسبت به جما ۳

گوگل می‌گوید مدل ۳۱ میلیارد پارامتری جما ۴ به‌زودی در جایگاه سوم رتبه‌بندی Arena برای بهترین مدل‌های متن‌باز قرار می‌گیرد. با وجود این، حتی بزرگ‌ترین مدل این نسل، اندازه‌ای کوچک‌تر و هزینه‌ای کمتر از مدل‌های برتر بازار دارد.

جما ۴ با تکیه بر فناوری مشابه سری بسته‌ی جمنای ۳ ساخته شده و توانایی‌های بهبودیافته‌ای در استدلال، ریاضیات و اجرای دقیق دستورالعمل‌ها ارائه می‌دهد. هم‌زمان با تغییر رویکرد هوش مصنوعی به سمت مدیریت جریان کار، این مدل‌ها با پشتیبانی داخلی از function calling، تولید JSON ساختاریافته و دستورالعمل‌های بومی برای ابزارها و APIهای رایج طراحی شده‌اند.

تمرکز ویژه بر کدنویسی

تولید کد یکی از مهم‌ترین کاربردهای هوش مصنوعی شده و گوگل اعلام کرده جما ۴ برای این حوزه بهینه شده است. مدل‌های قدرتمند مانند Gemini Pro یا Cloud Code همچنان مبتنی بر فضای ابری هستند؛ اما گوگل معتقد است جما ۴ می‌تواند در صورت استفاده از سخت‌افزار مناسب، کیفیت مشابهی را در حالت کاملاً آفلاین ارائه دهد.

پشتیبانی گسترده زبانی و چندرسانه‌ای

جما ۴ در پردازش ورودی بصری عملکرد بهتری دارد و کارهایی مانند OCR و تحلیل نمودار را روی دستگاه‌های محلی دقیق‌تر انجام می‌دهد. مدل‌های E2B و E4B نیز از تشخیص گفتار بومی بهره می‌برند که نسبت به نسل قبلی ارتقا یافته است.

این مدل‌ها از بیش از ۱۴۰ زبان پشتیبانی می‌کنند و حافظه متنی آن‌ها نیز افزایش یافته است:

• مدل‌های کوچک اکنون ۱۲۸ هزار توکن ظرفیت دارند.

• مدل‌های ۲۶B و ۳۱B تا ۲۵۶ هزار توکن را پردازش می‌کنند.

(در مقابل، جمنای همچنان تا ۱ میلیون توکن پشتیبانی می‌کند.)

تحول در سیاست‌های مجوزدهی

یکی از مهم‌ترین تغییرات جما ۴، تغییر مجوز آن به Apache 2.0 است. نسخه‌های قبلی از یک مجوز سفارشی استفاده می‌کردند که محدودیت‌های زیادی داشت و حتی اجازه می‌داد گوگل به‌طور یک‌طرفه آن را تغییر دهد. توسعه‌دهندگان نگران بودند که این مجوز روی مدل‌های مشتق‌شده و پروژه‌های جانبی نیز تأثیر بگذارد.

Apache 2.0 برعکس، کاملاً آزاد، بدون محدودیت تجاری و مطابق با استانداردهای رایج صنعت است و اعتماد بیشتری برای استفاده عمومی ایجاد می‌کند.

گوگل می‌گوید افزایش آزادی و کنترل توسعه‌دهندگان بر داده‌ها و برنامه‌هایشان می‌تواند آن‌ها را ترغیب کند پروژه‌های بیشتری را بر پایه جما توسعه دهند؛ مسیری که گوگل آن را «جماورس» می‌نامد.

انتشار مدل‌های سبک E2B و E4B نشان‌دهنده تلاش جدی گوگل برای گسترش هوش مصنوعی روی دستگاه‌های موبایل است. در حال حاضر گوشی‌های پیکسل و برخی دستگاه‌های دیگر از مدل‌های محلی «جمنای نانو» استفاده می‌کنند که بر اساس نسخه‌ی 3n ساخته شده‌اند.

این مدل‌های هوش مصنوعی امکان انجام پردازش‌هایی مانند تشخیص تماس‌ها و پیام‌های مشکوک، خلاصه‌کردن یادداشت‌ها و تولید خلاصه تماس‌های تلفنی را بدون نیاز به اینترنت و بدون ارسال داده‌ها به فضای ابری فراهم می‌کنند.

گوگل اعلام کرده نسل جدید نانو ۴ نیز بر پایه نسخه‌های ۲ و ۴ میلیارد پارامتری توسعه خواهد یافت که معادل مدل‌های Gemma 4 E2B و E4B هستند.

همچنین گوگل از توسعه‌دهندگان خواسته است تا با مراجعه به جدیدترین Core Developer Preview، کار با این مدل‌های تازه را آغاز کنند. سیستم‌هایی که روی این دو مدل طراحی شوند، در زمان عرضه رسمی Gemini Nano 4 نیز بدون مشکل قابل استفاده خواهند بود.

ارسال دیدگاه

    هیچ دیدگاهی برای این مطلب ثبت نشده است.