İçeriğe geç
Seviye C — Uzman
Çalıştığı yer:USYapıldığı yer:United States
Google Gemini

Gemma 3n E4B

Seviye C — Uzman · 8K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan··

Gemma 3n E4B, Google tarafından Gemini dil modelleri ailesinin bir parçası olarak geliştirilen bir metin üretim modelidir. İçerik oluşturma, sohbet uygulamaları, soru yanıtlama ve genel doğal dil işleme iş akışları dahil olmak üzere standart metin üretim görevleri için tasarlanmıştır. Model, 8.000 token'lık bir bağlam penceresiyle çalışır; bu da orta boyutlu belgeler veya konuşma dizileri boyunca tutarlılığı korumasına olanak tanır. "E4B" tanımlaması, bu sürümün verimlilik için optimize edilmiş bir varyant olduğunu gösterir; muhtemelen hesaplama gereksinimlerini ve bellek kullanımını azaltırken kabul edilebilir performans seviyelerini koruyan 4-bit niceleme kullanılmaktadır. Bu niceleme yaklaşımı, modeli tam hassasiyetli alternatiflere kıyasla kaynak kısıtlı ortamlarda dağıtım için daha erişilebilir kılar. 8K bağlam penceresi, kapsamlı belge işleme gerektirmeyen ancak makul bağlam korumadan yararlanan görevler için uygun olmasını sağlar. Google'ın model yelpazesinde Gemma 3n E4B, yetenek ile hesaplama verimliliği arasındaki dengeye odaklanan hafif bir seçenek olarak öne çıkar. Ölçek ve yetenek açısından Google'ın amiral gemisi Gemini modellerinin altında konumlanır; maksimum performans yerine daha hızlı çıkarım ve daha düşük kaynak tüketiminin öncelikli olduğu kullanım senaryolarını hedefler. Model, daha büyük modellerin altyapı gereksinimleri olmadan yetenekli bir metin üretim çözümü arayan geliştiriciler ve kuruluşlar için uygundur; özellikle sohbet botları, içerik yardım araçları, özetleme ve benzeri metin tabanlı görevler için elverişlidir.

Google altyapısıyla desteklenen bu model, geniş bilgi tabanını etkin biçimde kullanıyor.

Tokonomix benchmark özeti
Bölüm 01

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Açık ağırlık modeliYerel dağıtıma uygunMetin üretimi ve özetlemeÇok turlu sohbet desteğiTalimat takibinde yüksek başarıDoğal dil anlama kapasitesi

Zayıf yönler

Kısa bağlam penceresiİnternet erişimi bulunmuyorGörsel işleme desteği yok
Bölüm 02

Yetenekler

outputTokenLimit: 2048
Bölüm 03

Sık sorulan sorular

Model ağırlıklarını indirip kendi altyapınızda çalıştırabilirsiniz; tam kontrol ve özelleştirme imkânı sunar.

Google Gemini ekosistemiyle entegre çalışan bu model kurumsal iş akışlarını hızlandırıyor.

Tokonomix benchmark özeti
Bölüm 04

Kullanılabilirlik

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 05

Tokonomix kıyaslama kararları

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-566/100 · 4 runs
2 correct0 partial2 wrong50% accuracy
2026-05-22

Gemma 3n E4B güçlü kodlama, zayıf matematiksel akıl yürütmeyle sahneye çıkıyor

Gemma 3n E4B, Google'ın en yeni kompakt modeli olarak değerlendirme kategorileri genelinde karışık bir performans profili sergileyerek benchmark sahnesine giriyor. Model, kodlama görevlerinde dikkat çekici bir güç gösteriyor; HumanEval'da 56.8 ve MBPP'de 51.9 puan alarak programlama uygulamaları için rekabetçi bir konum elde ediyor. Talimat takip yetenekleri IFEval'da 57.7 ile orta düzeyde olup kullanıcı yönergelerine makul bir bağlılık gösteriyor. Ancak matematiksel akıl yürütme net bir zayıflık olarak öne çıkıyor; model GSM8K'de yalnızca 12.0 ve MATH'te 3.6 puan alarak niceliksel problem çözmede önemli sınırlılıklar olduğuna işaret ediyor. Genel bilgi performansı MMLU'da 61.9 düzeyinde olup geniş alan kavrayışında yeterli ancak istisnai olmayan bir tablo yansıtıyor. Model, analitik veya matematiksel görevlerden çok kod üretimi iş akışları için optimize edilmiş görünüyor. Hafif bir kodlama asistanı arayan kullanıcılar burada değer bulabilir, ancak güçlü matematiksel akıl yürütme veya karmaşık analitik yetenekler gerektirenler alternatifleri değerlendirmelidir. Bir başlangıç girişi olarak Gemma 3n E4B, kendini belirgin güçlü yönleri ve sınırlılıklarıyla uygun kullanım senaryolarını tanımlayacak özelleşmiş bir araç olarak konumlandırıyor.

Quality

Latency p50

Test runs

0

Güçlü kodlama performansı Yarışmacı programlama kıyaslamaları Çok zayıf matematiksel akıl yürütme Sınırlı analitik yetenekler
Bölüm 06

Tam model profili

Gemma 3n E4B — illustration 1
Gemma 3n E4B: mobil öncelikli Gemma'nın daha büyük varyantı

Gemma 3n E4B, Google'ın iki mobil-optimize Gemma 3 varyantından daha büyük olanıdır. Her ileri geçişte yaklaşık dört milyar etkili aktif parametre, görüntü girişi desteği ve 8.192 token'lık bağlam penceresi sunar. E2B kardeşiyle aynı seçici parametre yükleme mimarisini paylaşır, ancak küçük modelin kabiliyet tavanının darboğaz oluşturduğu iş yükleri için ölçeklendirilmiştir.

E2B'nin sağladığından daha kapsamlı cihaz üstü kabiliyete ihtiyaç duyan mobil ve gömülü ürünlere yazılım gönderen ekipler için 3n ailesi içindeki yükseltme hedefi budur.

E4B'nin E2B'de olmayan yaptıkları

E2B ve E4B arasındaki kabiliyet farkı, standart yoğun ailedeki Gemma 3 1B ile 4B arasındaki farkı yansıtır — gerçek iş yüklerinde hissedilecek kadar belirgin, ancak kategoriyi değiştirecek kadar dramatik değil.

Akıl yürütme alanı. E4B, çok adımlı yönlendirmeleri E2B'den daha güvenilir biçimde işler. Bir kullanıcının soru sorup ardından açıklama eklediği ve modelin bağlamı tur boyunca takip etmesi gereken konuşma türü etkileşim, daha büyük boyutta daha akıcı çalışır.

Görüntü girişi kalitesi. E4B'deki görüntü kabiliyeti, E2B'dekinden anlamlı ölçüde daha iyidir. Yoğun ekran görüntüleri, daha karmaşık sahneler ve metin ağırlıklı görüntüler daha güvenilir çıktılar üretir. Görüntü anlayışının gerçekten kullanılabilir nitelikte olmasına bağlı mobil özellikler için E4B genellikle başlangıç noktasıdır.

Üretim kalitesi. E4B'nin metin çıktısı daha çeşitli ve E2B çıktısından daha az kısıtlı hissettirir. Modelin ürettiği içeriğin kullanıcıya doğrudan yansıdığı özelliklerde — yanıt taslağı hazırlamak, özetlemek, açıklamak — daha büyük modelin çıktısı daha iyi okunur.

Değişmeyen şey mimaridir. Her iki 3n varyantı da seçici yükleme yaklaşımını, dağıtım yığını gereksinimlerini ve 8.192 token'lık bağlam penceresini paylaşır. Küçük varyant platform destek hikâyenize uymuyorsa, büyük olanı da uymayacaktır.

Yelpazedeki konumu

Gemma 3n ailesi, mobil dağıtım için yanıt olarak konumlandırılmıştır. Düşünülmesi gereken üç sınır koşulu vardır.

E4B'ye karşı standart Gemma 3 4B. İkisi de yüzeyde kabaca 4B-etkilidir. E4B'nin seçici yükleme mimarisi, RAM'i kısıtlı cihazlarda bellek dostudur. Standart Gemma 3 4B'nin açık kaynak ekosisteminde daha geniş çalışma zamanı desteği ve daha olgun araçları vardır. MediaPipe üzerinden mobil dağıtım için E4B doğru seçimdir. Sunucu GPU'sunda öz-barındırmalı dağıtım için standart 4B operasyonel olarak daha basittir.

E4B'ye karşı E2B. Aynı mimari, farklı kabiliyet katmanı. İş yükü ek kabiliyetten yararlanıyorsa ve hedef donanım daha büyük çalışma zamanı ayak izini soğurabiliyorsa E4B doğru seçimdir. Eski mobil donanım için veya pil ve bellek bütçelerinin bağlayıcı kısıt olduğu özellikler için E2B doğru seçim olmaya devam eder.

E4B'ye karşı bulut API'leri. Yalnızca kabiliyet açısından, Gemini Flash ailesinden veya rakip sağlayıcılardan bulut API'leri E4B'yi açık ara geride bırakır. Gemma 3n'in önermesi bulutla kabiliyet paritesi değildir; ağ bağımlılığı olmadan, çağrı başı maliyet olmadan ve veriler cihazdan çıkmadan kabul edilebilir kabiliyettir.

Yetersiz kaldığı yerler

Zorlu akıl yürütme. E4B orta karmaşıklığı iyi idare eder; en zor akıl yürütme yönlendirmelerini idare edemez. Gerçekten bulut sınırı sınıfı kabiliyete ihtiyaç duyan iş yükleri için, hangi modeli seçerseniz seçin cihaz üstü yanlış dağıtım hedefidir.

Uzun bağlam. 8.192 token'lık pencere mevcut standartlara göre kısıtlayıcıdır. Daha uzun belgeleri cihaz üstünde işlemesi gereken iş yükleri parçalama stratejilerine veya alma-artırılmış desenlere ihtiyaç duyar; her ikisi de boru hattı karmaşıklığı ekler.

Platformlar arası dağıtım tutarlılığı. Seçici yükleme mimarisinin en iyi desteği Google'ın kendi MediaPipe çalışma zamanındadır. Diğer dağıtım yolları mevcuttur ancak olgunluk daha az tamamlanmıştır. Taahhüt etmeden önce hedef platformlarda desteği doğrulayın.

Pil ve termal zarf. E4B çıkarımı, telefonlarda E2B çıkarımından daha taleplidir. Sürekli kullanım cihazı anlamlı şekilde ısıtabilir ve pil ömrünü etkiler. Kullanıcı girişini net istek sınırları içinde gruplayan etkileşim desenleri tasarlayın ve her tuş vuruşunda veya sensör olayında modeli çalıştırmaktan kaçının.

Donanım hikâyesi

E4B etrafındaki dağıtım ekosistemi E2B ile aynıdır; ek olarak E4B'nin daha büyük aktif parametre ayak izi donanım üzerinde daha fazla baskı yaratır.

Yakın tarihli amiral gemisi SoC'li Android üzerinde MediaPipe en olgun dağıtım yoludur. Performans, etkileşimli kullanım durumları için kabul edilebilirdir. Eski veya orta segment Android cihazlar E4B'yi çalıştırabilir, ancak gecikme hikâyesi kötüleşir ve pil etkisi anlamlı hale gelir.

MediaPipe üzerinden iOS, yakın tarihli iPhone ve iPad'lerde çalışır. Apple Neural Engine desteği kısmidir; mimarinin sağlamak üzere tasarlandığı kazanımların bir kısmı iOS'a iner, bir kısmı inmez. Hedef cihazlarda kıyaslama yapın.

3n ailesi için llama.cpp desteği, E2B için geçerli olan aynı uyarılarla E4B'yi çalıştırır — işlevsel, ancak seçici yükleme optimizasyonları her çalışma zamanı üzerinden tam olarak açığa çıkmaz. Özellikle llama.cpp'yi hedefleyen dağıtımlar için gerçek donanımda kıyaslama yapın.

Tarayıcılarda WebGPU dağıtımı prensipte çalışır ve gelişiyor, ancak tarayıcı çalışma zamanları üzerinden E4B'nin üretim dağıtımı hâlâ ekosistemin temiz biçimde desteklediği sınırın kenarındadır. Gerçek güvenilirlik gerektiren tarayıcı tabanlı özellikler için, daha küçük E2B varyantı veya standart Gemma 3 1B bugün daha güvenli seçimlerdir.

Sahaya karşı

Cihaz üstü 4B-etkili katmanı, E4B'yi karşılaştırılabilir ölçeklerde Microsoft'un Phi-3 ailesi, iOS dağıtımları için Apple'ın cihaz üstü modelleri ve benzer dağıtım desenlerini hedefleyen daha küçük Llama ve Qwen varyantları ile rekabete sokar.

Her birinin kendine özgü bir mizacı vardır. Phi-3, bu ölçekte akıl yürütme kıyaslamalarında rekabetçidir. Apple'ın modelleri en derin iOS entegrasyonuna sahiptir ancak Android'e veya diğer platformlara giden bir yolu yoktur. Daha küçük Llama ve Qwen varyantları daha geniş çalışma zamanı desteğine sahiptir ancak seçici yükleme optimizasyonu yoktur.

E4B'nin ayırt edici konumu, görüntü girişi ve Google'ın dağıtım araçları entegrasyonu ile birleştirilen seçici yükleme mimarisidir. MediaPipe yığını ile Android'i hedefleyen ve görüntü destekli cihaz üstü özelliklere ihtiyaç duyan ekipler için E4B, açık ağırlık alanında en az dirençli yoldur.

Dağıtım notları

Dağıtım desenleri, daha büyük model boyutunda gerekli ek kıyaslamayla birlikte E2B'yi yansıtır.

Niceleme çalışır ancak seçici yüklemeyle etkileşim inceliklidir. Daha küçük modellerden elde edilen sonuçların aktarılacağını varsaymak yerine hedef donanımda test edin.

Temsili cihazlarda pil ve termal kıyaslama, lansman kontrol listesinin parçasıdır. Amiral gemisi donanımdaki laboratuvar testleri, kullanıcıların çoğunluğunun bulunduğu orta segment cihazlarda gerçek dünya davranışını öngörmez.

Daha geniş cihaz üstü rehberlik için bkz. /usecases/local.

Seçim

Şu durumlarda Gemma 3n E4B'ye uzanın:

  • Ek ayak izini soğurabilen mobil donanımda E2B'den daha fazla kabiliyete ihtiyacınız var.
  • Cihaz üstü özelliklerde metnin yanında görüntü girişine ihtiyacınız var.
  • Yakın tarihli Android cihazlarda Google'ın MediaPipe çalışma zamanı yığını üzerinden dağıtım yapıyorsunuz.

Bellek veya pil bütçeleri sıkışıksa E2B'ye inin. Öz-barındırmalı sunucu dağıtımı hedefse ve çalışma zamanı taşınabilirliği mobil optimizasyondan daha önemliyse standart Gemma 3 4B'ye geçin.

Son teknik inceleme: 2026-05-22 — Tokonomix.ai

Gemma 3n E4B — illustration 2
Son otomatik test
24 May 2026 · 04:55 UTC · Test
P50 gecikme
P95 gecikme
Hatalar
1 / 6 çalıştırma
Son inceleyen Tokonomix Ekibi·26 Mayıs 2026