
Gemma 3n E4B, Google'ın iki mobil-optimize Gemma 3 varyantından daha büyük olanıdır. Her ileri geçişte yaklaşık dört milyar etkili aktif parametre, görüntü girişi desteği ve 8.192 token'lık bağlam penceresi sunar. E2B kardeşiyle aynı seçici parametre yükleme mimarisini paylaşır, ancak küçük modelin kabiliyet tavanının darboğaz oluşturduğu iş yükleri için ölçeklendirilmiştir.
E2B'nin sağladığından daha kapsamlı cihaz üstü kabiliyete ihtiyaç duyan mobil ve gömülü ürünlere yazılım gönderen ekipler için 3n ailesi içindeki yükseltme hedefi budur.
E4B'nin E2B'de olmayan yaptıkları
E2B ve E4B arasındaki kabiliyet farkı, standart yoğun ailedeki Gemma 3 1B ile 4B arasındaki farkı yansıtır — gerçek iş yüklerinde hissedilecek kadar belirgin, ancak kategoriyi değiştirecek kadar dramatik değil.
Akıl yürütme alanı. E4B, çok adımlı yönlendirmeleri E2B'den daha güvenilir biçimde işler. Bir kullanıcının soru sorup ardından açıklama eklediği ve modelin bağlamı tur boyunca takip etmesi gereken konuşma türü etkileşim, daha büyük boyutta daha akıcı çalışır.
Görüntü girişi kalitesi. E4B'deki görüntü kabiliyeti, E2B'dekinden anlamlı ölçüde daha iyidir. Yoğun ekran görüntüleri, daha karmaşık sahneler ve metin ağırlıklı görüntüler daha güvenilir çıktılar üretir. Görüntü anlayışının gerçekten kullanılabilir nitelikte olmasına bağlı mobil özellikler için E4B genellikle başlangıç noktasıdır.
Üretim kalitesi. E4B'nin metin çıktısı daha çeşitli ve E2B çıktısından daha az kısıtlı hissettirir. Modelin ürettiği içeriğin kullanıcıya doğrudan yansıdığı özelliklerde — yanıt taslağı hazırlamak, özetlemek, açıklamak — daha büyük modelin çıktısı daha iyi okunur.
Değişmeyen şey mimaridir. Her iki 3n varyantı da seçici yükleme yaklaşımını, dağıtım yığını gereksinimlerini ve 8.192 token'lık bağlam penceresini paylaşır. Küçük varyant platform destek hikâyenize uymuyorsa, büyük olanı da uymayacaktır.
Yelpazedeki konumu
Gemma 3n ailesi, mobil dağıtım için yanıt olarak konumlandırılmıştır. Düşünülmesi gereken üç sınır koşulu vardır.
E4B'ye karşı standart Gemma 3 4B. İkisi de yüzeyde kabaca 4B-etkilidir. E4B'nin seçici yükleme mimarisi, RAM'i kısıtlı cihazlarda bellek dostudur. Standart Gemma 3 4B'nin açık kaynak ekosisteminde daha geniş çalışma zamanı desteği ve daha olgun araçları vardır. MediaPipe üzerinden mobil dağıtım için E4B doğru seçimdir. Sunucu GPU'sunda öz-barındırmalı dağıtım için standart 4B operasyonel olarak daha basittir.
E4B'ye karşı E2B. Aynı mimari, farklı kabiliyet katmanı. İş yükü ek kabiliyetten yararlanıyorsa ve hedef donanım daha büyük çalışma zamanı ayak izini soğurabiliyorsa E4B doğru seçimdir. Eski mobil donanım için veya pil ve bellek bütçelerinin bağlayıcı kısıt olduğu özellikler için E2B doğru seçim olmaya devam eder.
E4B'ye karşı bulut API'leri. Yalnızca kabiliyet açısından, Gemini Flash ailesinden veya rakip sağlayıcılardan bulut API'leri E4B'yi açık ara geride bırakır. Gemma 3n'in önermesi bulutla kabiliyet paritesi değildir; ağ bağımlılığı olmadan, çağrı başı maliyet olmadan ve veriler cihazdan çıkmadan kabul edilebilir kabiliyettir.
Yetersiz kaldığı yerler
Zorlu akıl yürütme. E4B orta karmaşıklığı iyi idare eder; en zor akıl yürütme yönlendirmelerini idare edemez. Gerçekten bulut sınırı sınıfı kabiliyete ihtiyaç duyan iş yükleri için, hangi modeli seçerseniz seçin cihaz üstü yanlış dağıtım hedefidir.
Uzun bağlam. 8.192 token'lık pencere mevcut standartlara göre kısıtlayıcıdır. Daha uzun belgeleri cihaz üstünde işlemesi gereken iş yükleri parçalama stratejilerine veya alma-artırılmış desenlere ihtiyaç duyar; her ikisi de boru hattı karmaşıklığı ekler.
Platformlar arası dağıtım tutarlılığı. Seçici yükleme mimarisinin en iyi desteği Google'ın kendi MediaPipe çalışma zamanındadır. Diğer dağıtım yolları mevcuttur ancak olgunluk daha az tamamlanmıştır. Taahhüt etmeden önce hedef platformlarda desteği doğrulayın.
Pil ve termal zarf. E4B çıkarımı, telefonlarda E2B çıkarımından daha taleplidir. Sürekli kullanım cihazı anlamlı şekilde ısıtabilir ve pil ömrünü etkiler. Kullanıcı girişini net istek sınırları içinde gruplayan etkileşim desenleri tasarlayın ve her tuş vuruşunda veya sensör olayında modeli çalıştırmaktan kaçının.
Donanım hikâyesi
E4B etrafındaki dağıtım ekosistemi E2B ile aynıdır; ek olarak E4B'nin daha büyük aktif parametre ayak izi donanım üzerinde daha fazla baskı yaratır.
Yakın tarihli amiral gemisi SoC'li Android üzerinde MediaPipe en olgun dağıtım yoludur. Performans, etkileşimli kullanım durumları için kabul edilebilirdir. Eski veya orta segment Android cihazlar E4B'yi çalıştırabilir, ancak gecikme hikâyesi kötüleşir ve pil etkisi anlamlı hale gelir.
MediaPipe üzerinden iOS, yakın tarihli iPhone ve iPad'lerde çalışır. Apple Neural Engine desteği kısmidir; mimarinin sağlamak üzere tasarlandığı kazanımların bir kısmı iOS'a iner, bir kısmı inmez. Hedef cihazlarda kıyaslama yapın.
3n ailesi için llama.cpp desteği, E2B için geçerli olan aynı uyarılarla E4B'yi çalıştırır — işlevsel, ancak seçici yükleme optimizasyonları her çalışma zamanı üzerinden tam olarak açığa çıkmaz. Özellikle llama.cpp'yi hedefleyen dağıtımlar için gerçek donanımda kıyaslama yapın.
Tarayıcılarda WebGPU dağıtımı prensipte çalışır ve gelişiyor, ancak tarayıcı çalışma zamanları üzerinden E4B'nin üretim dağıtımı hâlâ ekosistemin temiz biçimde desteklediği sınırın kenarındadır. Gerçek güvenilirlik gerektiren tarayıcı tabanlı özellikler için, daha küçük E2B varyantı veya standart Gemma 3 1B bugün daha güvenli seçimlerdir.
Sahaya karşı
Cihaz üstü 4B-etkili katmanı, E4B'yi karşılaştırılabilir ölçeklerde Microsoft'un Phi-3 ailesi, iOS dağıtımları için Apple'ın cihaz üstü modelleri ve benzer dağıtım desenlerini hedefleyen daha küçük Llama ve Qwen varyantları ile rekabete sokar.
Her birinin kendine özgü bir mizacı vardır. Phi-3, bu ölçekte akıl yürütme kıyaslamalarında rekabetçidir. Apple'ın modelleri en derin iOS entegrasyonuna sahiptir ancak Android'e veya diğer platformlara giden bir yolu yoktur. Daha küçük Llama ve Qwen varyantları daha geniş çalışma zamanı desteğine sahiptir ancak seçici yükleme optimizasyonu yoktur.
E4B'nin ayırt edici konumu, görüntü girişi ve Google'ın dağıtım araçları entegrasyonu ile birleştirilen seçici yükleme mimarisidir. MediaPipe yığını ile Android'i hedefleyen ve görüntü destekli cihaz üstü özelliklere ihtiyaç duyan ekipler için E4B, açık ağırlık alanında en az dirençli yoldur.
Dağıtım notları
Dağıtım desenleri, daha büyük model boyutunda gerekli ek kıyaslamayla birlikte E2B'yi yansıtır.
Niceleme çalışır ancak seçici yüklemeyle etkileşim inceliklidir. Daha küçük modellerden elde edilen sonuçların aktarılacağını varsaymak yerine hedef donanımda test edin.
Temsili cihazlarda pil ve termal kıyaslama, lansman kontrol listesinin parçasıdır. Amiral gemisi donanımdaki laboratuvar testleri, kullanıcıların çoğunluğunun bulunduğu orta segment cihazlarda gerçek dünya davranışını öngörmez.
Daha geniş cihaz üstü rehberlik için bkz. /usecases/local.
Seçim
Şu durumlarda Gemma 3n E4B'ye uzanın:
- Ek ayak izini soğurabilen mobil donanımda E2B'den daha fazla kabiliyete ihtiyacınız var.
- Cihaz üstü özelliklerde metnin yanında görüntü girişine ihtiyacınız var.
- Yakın tarihli Android cihazlarda Google'ın MediaPipe çalışma zamanı yığını üzerinden dağıtım yapıyorsunuz.
Bellek veya pil bütçeleri sıkışıksa E2B'ye inin. Öz-barındırmalı sunucu dağıtımı hedefse ve çalışma zamanı taşınabilirliği mobil optimizasyondan daha önemliyse standart Gemma 3 4B'ye geçin.
Son teknik inceleme: 2026-05-22 — Tokonomix.ai
