گوگل از نسل جدید هوش مصنوعی خود با نام «جما ۴» رونمایی کرد؛ مجموعهای از مدلهای متنوع که با هدف تقویت پردازش محلی و کاهش وابستگی به سرویسهای ابری توسعه یافتهاند.
درحالیکه مدلهای خانواده جمنای پیشرفتهای بزرگی تجربه کردهاند، محدود بودن آنها به اکوسیستم گوگل استفادهی گسترده را دشوار میکرد. جما ۴ این محدودیت را برطرف کرده و در چهار اندازهی مختلف ارائه میشود تا بتوان آن را روی انواع سختافزارهای شخصی اجرا کرد.
قدرت بیشتر، دسترسی آسانتر
دو مدل بزرگتر این خانواده، یعنی 26B Mixture of Experts و 31B Dense (با ۲۶ و ۳۱ میلیارد پارامتر)، قادرند بدون نیاز به کوانتیزهسازی و با فرمت bfloat16 روی کارتهای گرافیک H100 با حافظه ۸۰ گیگابایتی اجرا شوند. هرچند این کارتها قیمت بالایی دارند، اما امکان اجرای کاملاً محلی مدل را فراهم میکنند. همچنین با کاهش دقت و اعمال کوانتیزهسازی، اجرای این مدلها روی GPUهای گیمینگ و ارزانتر نیز ممکن میشود.
تمرکز اصلی گوگل در جما ۴ کاهش تأخیر و بهبود عملکرد پردازش آفلاین بوده است. در مدل 26B Mixture of Experts هنگام استنتاج تنها ۳.۸ میلیارد پارامتر فعال میشود که سرعت را بهطور قابل توجهی افزایش میدهد. مدل 31B Dense بیشتر روی ارائهی کیفیت بالاتر متمرکز است و گوگل انتظار دارد توسعهدهندگان آن را برای نیازهای تخصصی خود سفارشیسازی کنند.
مدلهای سبک «نانو» برای گوشیها
گوگل دو مدل سبکتر جما ۴ با نامهای Effective 2B (E2B) و Effective 4B (E4B) را معرفی کرده که بهطور ویژه برای اجرا روی گوشیهای هوشمند طراحی شدهاند. تمرکز اصلی این مدلها کاهش مصرف رم در زمان استنتاج است و بهترتیب ۲ و ۴ میلیارد پارامتر مؤثر را پردازش میکنند.
تیم پیکسل گوگل با همکاری کوالکام و مدیاتک این مدلها را برای دستگاههایی مانند گوشیهای موبایل، Raspberry Pi و جتسون نانو بهینه کرده است. نسل جدید نسبت به جما ۳ انرژی کمتر مصرف میکند، رم کمتری نیاز دارد و با «تأخیر تقریباً صفر» کار میکند.
بهبودهای چشمگیر نسبت به جما ۳
گوگل میگوید مدل ۳۱ میلیارد پارامتری جما ۴ بهزودی در جایگاه سوم رتبهبندی Arena برای بهترین مدلهای متنباز قرار میگیرد. با وجود این، حتی بزرگترین مدل این نسل، اندازهای کوچکتر و هزینهای کمتر از مدلهای برتر بازار دارد.
جما ۴ با تکیه بر فناوری مشابه سری بستهی جمنای ۳ ساخته شده و تواناییهای بهبودیافتهای در استدلال، ریاضیات و اجرای دقیق دستورالعملها ارائه میدهد. همزمان با تغییر رویکرد هوش مصنوعی به سمت مدیریت جریان کار، این مدلها با پشتیبانی داخلی از function calling، تولید JSON ساختاریافته و دستورالعملهای بومی برای ابزارها و APIهای رایج طراحی شدهاند.
تمرکز ویژه بر کدنویسی
تولید کد یکی از مهمترین کاربردهای هوش مصنوعی شده و گوگل اعلام کرده جما ۴ برای این حوزه بهینه شده است. مدلهای قدرتمند مانند Gemini Pro یا Cloud Code همچنان مبتنی بر فضای ابری هستند؛ اما گوگل معتقد است جما ۴ میتواند در صورت استفاده از سختافزار مناسب، کیفیت مشابهی را در حالت کاملاً آفلاین ارائه دهد.
پشتیبانی گسترده زبانی و چندرسانهای
جما ۴ در پردازش ورودی بصری عملکرد بهتری دارد و کارهایی مانند OCR و تحلیل نمودار را روی دستگاههای محلی دقیقتر انجام میدهد. مدلهای E2B و E4B نیز از تشخیص گفتار بومی بهره میبرند که نسبت به نسل قبلی ارتقا یافته است.
این مدلها از بیش از ۱۴۰ زبان پشتیبانی میکنند و حافظه متنی آنها نیز افزایش یافته است:
• مدلهای کوچک اکنون ۱۲۸ هزار توکن ظرفیت دارند.
• مدلهای ۲۶B و ۳۱B تا ۲۵۶ هزار توکن را پردازش میکنند.
(در مقابل، جمنای همچنان تا ۱ میلیون توکن پشتیبانی میکند.)
تحول در سیاستهای مجوزدهی
یکی از مهمترین تغییرات جما ۴، تغییر مجوز آن به Apache 2.0 است. نسخههای قبلی از یک مجوز سفارشی استفاده میکردند که محدودیتهای زیادی داشت و حتی اجازه میداد گوگل بهطور یکطرفه آن را تغییر دهد. توسعهدهندگان نگران بودند که این مجوز روی مدلهای مشتقشده و پروژههای جانبی نیز تأثیر بگذارد.
Apache 2.0 برعکس، کاملاً آزاد، بدون محدودیت تجاری و مطابق با استانداردهای رایج صنعت است و اعتماد بیشتری برای استفاده عمومی ایجاد میکند.
گوگل میگوید افزایش آزادی و کنترل توسعهدهندگان بر دادهها و برنامههایشان میتواند آنها را ترغیب کند پروژههای بیشتری را بر پایه جما توسعه دهند؛ مسیری که گوگل آن را «جماورس» مینامد.
انتشار مدلهای سبک E2B و E4B نشاندهنده تلاش جدی گوگل برای گسترش هوش مصنوعی روی دستگاههای موبایل است. در حال حاضر گوشیهای پیکسل و برخی دستگاههای دیگر از مدلهای محلی «جمنای نانو» استفاده میکنند که بر اساس نسخهی 3n ساخته شدهاند.
این مدلهای هوش مصنوعی امکان انجام پردازشهایی مانند تشخیص تماسها و پیامهای مشکوک، خلاصهکردن یادداشتها و تولید خلاصه تماسهای تلفنی را بدون نیاز به اینترنت و بدون ارسال دادهها به فضای ابری فراهم میکنند.
گوگل اعلام کرده نسل جدید نانو ۴ نیز بر پایه نسخههای ۲ و ۴ میلیارد پارامتری توسعه خواهد یافت که معادل مدلهای Gemma 4 E2B و E4B هستند.
همچنین گوگل از توسعهدهندگان خواسته است تا با مراجعه به جدیدترین Core Developer Preview، کار با این مدلهای تازه را آغاز کنند. سیستمهایی که روی این دو مدل طراحی شوند، در زمان عرضه رسمی Gemini Nano 4 نیز بدون مشکل قابل استفاده خواهند بود.
هیچ دیدگاهی برای این مطلب ثبت نشده است.