KTUN · YAZGİT Community

Türkçe için State Space modelleri geliştiriyoruz

Mamba & Jamba mimarilerini Türkçe'ye uyarlayan açık kaynak araştırma ekibi.
130M'den 3B'ye — her ölçekte Türkçe dil modeli.

Modelleri Keşfet

Scroll

// Model Detayları

Türkçe SSM model ailesi

Mamba ve Jamba mimarilerini Türkçe continued pretraining ile uyarlıyoruz. Tüm modeller Apache 2.0 lisansı ile açık kaynak.

🟢 RELEASED

Mamba 130M Turkish

State Space Model · Selective SSM

state-spaces/mamba-130m-hf üzerine Türkçe continued pretraining. ~400MB Türkçe metin, ~80-120M token ile eğitildi. Hafif ve hızlı — fine-tuning için ideal başlangıç noktası.

Parametre130M

TensorF32

DonanımRTX 4060 Laptop

LisansApache 2.0

HuggingFace'de Görüntüle →

🟢 RELEASED

Mamba 370M Turkish

State Space Model · Selective SSM

130M'nin büyük kardeşi. Embedding uyumsuzluk sorunu bu modelde çözüldü. Türkçe akıcılık ve gramer tarafı güçlü — mantıksal tutarlılık için dataset iyileştirmeleri devam ediyor.

Parametre371.5M

RAM2,529 MB

Hız (CPU)1.15 tok/s

LisansApache 2.0

HuggingFace'de Görüntüle →

⚡ FLAGSHIP

Jamba2 3B Turkish

Hybrid SSM + Attention · Jamba Architecture

Takımın amiral gemisi. SSM ve Attention katmanlarını birleştiriyor — hem uzun bağlam hem güçlü anlama. 3B parametre ile Türkçe'nin en büyük SSM tabanlı modeli. 1.8x daha hızlı inference.

Parametre3,039.8M (3B)

RAM14,216 MB

Hız (CPU)2.11 tok/s

LisansApache 2.0

HuggingFace'de Görüntüle →

// Yetkinlikler

Uçtan uca AI altyapısı

Model eğitiminden deployment'a, her katmanda mühendislik desteği sunuyoruz.

Continued Pretraining

İngilizce base modelleri Türkçe'ye uyarlama. Tokenizer optimizasyonu, dataset temizliği ve embedding düzeltmeleriyle kaliteli adaptasyon.

3 model yayınlandı — 130M → 3B

Hybrid Mimari Araştırma

SSM + Attention birleşimi ile hem lineer inference hem güçlü reasoning. Jamba mimarisini Türkçe'ye ilk uyarlayan ekip.

Jamba2 3B — 1.8x hız artışı

Dataset Pipeline

Mevcut modeller ~400MB kazılmış Türkçe veri ile eğitildi. Yeni nesil modeller için GitHub üzerinden 300GB ham veri toplandı ve filtrelendi — MC4 ve OSCAR kaynaklarından tekrarsız birleştirilmiş ~67 milyon satırlık Türkçe veri seti hazırlandı.

Mevcut: ~400MB · Yeni veri seti: 300GB → 67M satır

Veri Setini İncele →

Açık Kaynak & Topluluk

Tüm modeller Apache 2.0 ile HuggingFace'de yayında. Fine-tuning rehberleri, bug raporları ve topluluk katkılarına açık.

Apache 2.0 — Ticari kullanıma uygun

// Test Sonuçları

Gerçek dünya benchmark'ları

CPU üzerinde yapılan bağımsız testler — Mamba 370M vs Jamba2 3B karşılaştırması.

Inference Hızı (tok/s)

CPU MODU — DAHA YÜKSEK DAHA İYİ

Ortalama Yanıt Süresi (saniye)

CPU MODU — DAHA DÜŞÜK DAHA İYİ

Kalite Puanları (5 üzerinden)

TÜRKÇE DOĞRULUK · KONU UYGUNLUĞU · TEKRAR SKORU · ANLAM TUTARLILIĞI

Mamba 370M Turkish

Jamba2 3B Turkish

RAM Kullanımı

CPU MODU — FLOAT32

Genel Kalite Skoru

5 ÜZERİNDEN — DAHA YÜKSEK DAHA İYİ

CPU: Intel Core Ultra 7 255HX

RAM: 30.8 GB

GPU: Yok (CPU modu)

Python: 3.12.3

Torch: 2.11.0+cpu

Tarih: 2026-03-24

// Model Karşılaştırma

Modellerimiz vs Açık Kaynak Ekosistem

40+ model arasından ikisini seçin, özelliklerini yan yana kıyaslayın.

Model A

Model B

* LinguAI modelleri Türkçe odaklı continued pretraining modelleridir. Türkçe performansı diğer modellere kıyasla avantajlıdır. Orijinal Mamba modelleri İngilizce base modellerdir.

Türkçe için State Space modelleri geliştiriyoruz

Modeller

Araştırma

Takım

Yol Haritası

Mamba 130M Turkish

Mamba 370M Turkish

Jamba2 3B Turkish

Continued Pretraining

Hybrid Mimari Araştırma

Dataset Pipeline

Açık Kaynak & Topluluk

Inference Hızı (tok/s)

Ortalama Yanıt Süresi (saniye)

Kalite Puanları (5 üzerinden)

RAM Kullanımı

Genel Kalite Skoru

Katkıda bulunmak ister misiniz?