İçeriğe geç
ceaksan
PREMIUM ai

LLM'ler Türkçe Yazarken Neden Hata Yapar? Claude Code ile Deterministik Çözüm

Büyük dil modelleri uzun Türkçe içerik üretirken ç, ğ, ı, ö, ş, ü karakterlerini düşürür. Bu sorunu sıfır token maliyetiyle çözen bir Claude Code eklentisinin geliştirilme süreci.

17 Oca 2026
TL;DR

LLM'ler Türkçe yazarken diyakritik (ç, ğ, ı, ö, ş, ü) düşürür. Prompt uyarıları yetersiz. hunspell tabanlı 4 katmanlı bir PostToolUse hook ile her düzenleme sonrası otomatik doğrulama yapan bir Claude Code eklentisi geliştirdim. Emin olmak adına 201 gerçek yazıda test ettim ve sonuç: ortalama 4.8 saniye, sıfır timeout.

Üyelik Gerekli

Bu içeriğe erişmek için giriş yapmanız ve Premium aboneliğine sahip olmanız gerekmektedir.

Önemli Noktalar
  • 01 LLM'lerde Türkçe diyakritik kaybı prompt düzeyinde çözülemez, deterministik bir doğrulama katmanı gerektirir
  • 02 hunspell ile 4 katmanlı tespit: öneri eşleme, brute-force varyant, belirsizlik tablosu
  • 03 PostToolUse hook mimarisi ile sıfır token maliyetli geri bildirim döngüsü
  • 04 201 gerçek yazıda benchmark: ortalama 4.8s, 0 timeout, %94+ doğruluk
Sık Sorulan Sorular (FAQ)
+ LLM'ler Türkçe yazarken neden diyakritik hata yapar?

Büyük dil modelleri uzun metin üretimi sırasında Türkçeye özgü karakterleri (ç, ğ, ı, ö, ş, ü) sistematik olarak ASCII karşılıklarına düşürür. 1500+ kelimede sistematik düşüş gözlemlenir.

+ Türkçe diyakritik sorunu prompt ile çözülebilir mi?

Hayır. Sistem prompt'u ile talimat ilk 500 kelimede işe yarar, ancak uzun içerik üretiminde model bu talimatı yavaş yavaş göz ardı eder. Deterministik bir doğrulama katmanı gerektirir.

+ Claude Code Türkçe diyakritik eklentisi nasıl çalışır?

Eklenti, Claude Code'un PostToolUse hook mekanizmasını kullanır. Her Edit veya Write işleminden sonra otomatik tetiklenir, dosya içeriğini hunspell ile analiz eder ve hata bulursa stderr üzerinden geri bildirim verir.

+ hunspell tabanlı 4 katmanlı tespit sistemi nedir?

Katman 0 kelime tekilleştirme, Katman 1 hunspell öneri eşleme, Katman 2 brute-force varyant üretimi, Katman 3 ise 2944 girişlik belirsizlik tablosu ile çalışır.

+ Türkçe diyakritik eklentisinin performansı nedir?

201 gerçek blog yazısında ortalama 4.81 saniye/dosya, sıfır timeout. 90 bilinen diyakritik hatasını içeren referans dosyada 90/90 tespit, sıfır yanlış pozitif.