GA4 Attribution Raporları yazısında direct şişmesinin neden yanlış bir metrik olduğunu, Source/Medium Debugging yazısında ölçüm altyapısının gerçek kaynağı nasıl gizlediğini ele almıştım. Bu yazıda ölçüm problemini içerik stratejisine taşıyorum: GEO’da görünürlük ile alıntılanma farklı metrikler ve bunları karıştırmak bütçe yakan bir hata.
Direkt Yanıt
GEO trust-signal checklist’i LLM görünürlüğünün eşiğini geçirir, alıntılanmayı tetiklemez. Alıntılanan içerik iki katmana sahip: güven sinyalleri (schema, yazar, resmi kaynak) ve çıkarılabilir yapı (tek cümlelik yanıt, sayısal öz, karşılaştırma iskeleti, orijinal veri, isimlendirilmiş çerçeve). İkinci katman olmadan sayfa LLM cevabında görülür ama alıntılanmaz.
Vaka Özeti
| Metrik | Değer |
|---|---|
| Taranan sayfa | ~2.500+ |
| Cluster | ~200 |
| İzlenen prompt | ~50+ |
| Citation URL taraması | ~8.200+ |
| Site eşleşmesi | ~150 |
| Gözlemlenen en dar ayrışma (bir cluster) | Visibility %96-100, Citation %0 |
Rakamlar yuvarlama ve aralık bildirimidir; domain-seviyesi eşleme ve prompt havuzu filtreleri sonrası gözlem değerleridir.
Site profili: Türkçe pazarda faaliyet gösteren, YMYL dikeyinde çalışan bir yayıncı, ~2.500+ yayımlanmış sayfa. Trust-signal seviyesi yüksek: yazar biyografileri, resmi kurum alıntıları, FAQPage ve Article schema, HTTPS, net tarih etiketleri. Checklist açısından ders niteliğinde.
Problem: Checklist Yanılgısı
Yaygın GEO önerileri şöyle: schema ekle, yazar bio yaz, SSL olmalı, resmi kaynağa bağlan, E-E-A-T sinyallerini güçlendir. Tümü doğru ve gerekli. Ama bu checklist tamamlandığında alıntılanmanın geldiğini iddia eden kaynak yok; yalnızca görünürlük eşiğinin geçildiği biliniyor.
GEO yazılarının büyük kısmı iki metriği birbirine karıştırıyor:
- Visibility: LLM cevabını üretirken sayfayı değerlendirmeye aldı mı?
- Citation: LLM cevabında sayfayı kaynak olarak adlandırdı mı veya doğrudan alıntıladı mı?
Bu iki metrik tek tabloya düştüğünde çıkan desen şaşırtıcı değil: görünürlük arttıkça citation otomatik artmıyor. Checklist’in ürettiği şey yalnızca birincisi.
Bulgu: Visibility %96-100, Citation %0
Söz konusu sitede ~200 cluster içinde yüksek trafikli ve yüksek görünürlüklü ~50+ prompt seçildi. GPT, Gemini ve Perplexity üzerinde sorgulandı. Cevaplardaki ~8.200+ citation URL’si tarandı, domain eşlemesi yapıldı.
Karşı örnek mevcut: aynı sitede 324 kelimelik bir sayfa ~49 citation aldı, 1.500+ kelimelik başka bir sayfa 0 citation aldı. Uzunluk tek başına belirleyici değil; belirleyici olan yapı.
Belirgin bir küme ortaya çıktı: visibility %96-100 bandında duran ve citation’ı sıfır olan cluster’lar. Yani LLM bu içerikleri görüyor, değerlendirmeye alıyor, cevabını şekillendirirken kullanıyor; ancak cevabın gösterdiği kaynak listesinde bu sayfalara yer vermiyor.
Ortak özellikleri:
- Schema ve yazar kimliği eksiksiz
- Resmi kurum alıntısı var
- Konu otoritesi GSC verisinde net (binlerce impression, orta CTR)
- İçerik uzun, ansiklopedik tonda, paragraf ağırlıklı
- Tek cümlelik yanıt yok, sayısal tablo yok, karşılaştırma iskeleti yok
- Özgün veri veya isimlendirilmiş çerçeve yok
Eksik olan şey güven değil, çıkarılabilirlik.
Neden Alıntılanmıyor
LLM cevap üretirken iki ayrı iş yapıyor: önce kimi sayfalara güvenileceğini eler (trust), sonra cevabın içine sığacak bir blok çeker (extract). Eleme aşamasında schema ve yazar sinyali belirleyici. Çekme aşamasında ise modelin içeri alabileceği, sıkıştırılmış bir birim gerekiyor.
Ansiklopedik paragraf bu birimi sunmuyor. Model o paragrafı okuyor, bilgiyi özümsüyor, kendi cümlesine dönüştürüyor ve kaynak olarak başka bir sayfa gösteriyor. Alıntı başka bir yere gidiyor çünkü başka sayfa modelin işini kolaylaştıran formatta yazılmış: tek satırda tanım, tabloda sayı, başlıkta karşılaştırma, bir yerde adı konmuş bir kavram.
Bu davranış modelin yapısal eğilimlerinden biri. LLM davranışsal bozulma modları yazısında bu eğilimlerin (özetleme bias’ı, kaynak kayması, paraphrase) neden ve nasıl oluştuğunu sistematik şekilde ele aldım; citation kaybı bu modların içerik stratejisine yansıyan yüzü.
Citation Trigger Framework
Citation’ı tetikleyen beş sinyal. Checklist’ten ayrı olarak, içeriğin yapısına dair sinyaller.
S1: Tek Cümlelik Doğrudan Yanıt
İlk paragrafta, ilk 50 kelime içinde, tek cümlede konunun cevabı. Bağlam değil, koşullu ifade değil, ısınma değil.
Yanlış: “Bu yazıda kredi kartı faiz hesaplamasının inceliklerini ele alacağız…”
Doğru: “Kredi kartı aylık faizi, bakiyenin günlük ortalamasına sözleşmeli oranın 30 güne uygulanmasıyla hesaplanır.”
Akademik dayanak: Aggarwal et al. (2024) quotation_addition yöntemiyle doğrudan alıntılanabilir ifadelerin citation oranını belirgin şekilde yükselttiğini ölçtü. İlk 50 kelime kısıtı SERP featured snippet pratiğinden gelen bir eşik; peer-reviewed bir kaynağa dayanmıyor.
S2: Sayısal Öz
İlk ekran içinde sayı barındıran tek bir tablo. Kaç tane, ne kadar, hangi aralıkta, hangi oran. LLM bu tabloyu olduğu gibi çekebilir.
Akademik dayanak: Aggarwal et al. (2024), test ettikleri 9 yöntem arasında statistics_addition müdahalesinin citation’ı en çok artıran yöntemlerden biri olduğunu raporladı (belirli sorgu tiplerinde +30-40% bandı).
S3: Karşılaştırma İskeleti
X vs Y, A ile B arasındaki fark, hangi durumda hangisi. LLM karşılaştırmalı sorularda (ki çoğu prompt böyle) doğrudan karşılaştırma barındıran sayfaya yönelir.
Akademik dayanak: Aggarwal et al. (2024) karşılaştırmalı query tipinde yapılandırılmış farklılaştırma içeren içeriğin tercih edildiğini gösterdi; cite_sources ve structure-focused müdahaleler bu sinyali destekliyor.
S4: Orijinal Veri veya Vaka
Başkasında olmayan bir sayı, bir vaka, bir ölçüm. Derivative içerik (başka kaynakları yeniden paketleyen sayfalar) LLM tarafından özümsenir ama kaynak gösterildiğinde alıntı başka siteye gider. Bu yazıdaki vakada 25+ citation alan sayfaların ortak özelliği, başka yerde bulunmayan orijinal veri bloğuydu (yapılandırılmış tablo, yaş-bazlı rehber, kurum kılavuzu özeti). Orijinal birim, alıntının sana gelmesini sağlayan şey.
Akademik dayanak: Google Search Quality Evaluator Guidelines E-E-A-T kriteri “original information, reporting, research” maddesini otorite sinyali olarak tanımlar. Helpful Content Update (2022-2024) dokümantasyonu orijinalliği ranking faktörü olarak açıklar.
S5: İsimlendirilmiş Çerçeve
“3 Adımlı X Yöntemi”, “Y Protokolü”, “Z Framework’ü”. İsmi olan kavramlar LLM için tekrar üretilebilir, yeniden sorgulandığında bulunabilir. İsimsiz akıl yürütme alıntılanmaz.
Dayanak: Bu sinyal ampirik bir gözlem, peer-reviewed akademik validasyonu yok. Content Intelligence pipeline’ında ~8.200+ citation URL taramasından çıkan örüntü: isimlendirilmiş çerçeveler ve spesifik terminoloji LLM cevaplarında daha sık geri üretiliyor ve kaynak atfı ile dönüyor. Sonraki ölçüm döngülerinde ayrı bir kontrollü test planlanıyor.
Checklist Hâlâ Gerekli mi
Evet. Trust-signal katmanı olmadan içerik görünürlük eşiğini geçemez ve Citation Trigger Framework devreye bile giremez. Çerçeve, checklist’in yerine geçmez; üstüne kurulur.
Sıralama şöyle:
- Trust katmanı: schema, yazar, SSL, resmi kaynak, HTTPS, doğru tarih. Eksiği kapat.
- Çıkarılabilirlik katmanı: Citation Trigger Framework’ün beş sinyali.
Eğer görünürlük düşükse birinci katman, görünürlük yüksek ama citation düşükse ikinci katman eksiktir.
Pratik Uygulama
Mevcut içeriği silmeden şu ekleri yap:
- Her sayfanın başına tek cümlelik yanıt bloğu
- Her sayfaya bir “Hızlı Referans” tablosu
- Karşılaştırmalı sorguya aday sayfalara X vs Y iskeleti
- En az bir orijinal sayı, bir vaka, bir ölçüm
- Mümkünse site çapında bir isimlendirilmiş çerçeve (bu yazıda yaptığım gibi)
Ardından aynı prompt setini tekrar sorgula, citation oranını ölç. Eğer çerçeve çalışıyorsa citation sıfırdan düzenli bir orana çıkar.
Metodoloji Notu
Bu yazıdaki sayılar bir müşteri pipeline çalışmasının anonim özetidir. Sitenin adı, domain ve cluster başlıkları paylaşılmıyor; metodoloji ve sayı aralıkları paylaşılıyor.
- Sorgulanan modeller: GPT, Gemini, Perplexity
- Veri kaynakları: GSC (~180 gün aggregate), GA4 (~90 gün), site crawl, bir GEO aracı üzerinden prompt/citation takibi
- Citation ölçümü URL ve domain düzeyinde eşleme ile yapıldı; paraphrase tespiti kapsam dışı
- Cluster analizi: multilingual-e5-large embedding, log-normalized 6-boyutlu skorlama (trafik, SEO, etkileşim, güncellik, kalite, GEO)
Ölçümü yapan altyapı Content Intelligence: GSC, GA4, site crawl ve GEO aracı çıktısını tek bir pipeline’da birleştirip cluster bazlı topic brief üreten kendi aracım. Prompt-sayfa eşleşmesi, orphan tespiti, visibility/citation ayrışma haritası ve cluster-başı aksiyon planı otomatik çıkıyor. Bu yazıdaki Citation Trigger Framework, Content Intelligence çıktılarından türetilmiş bir çerçeve.
İlgili Yazılar
- GA4 Attribution Raporları: Direct Şişmesi ve Model Seçimi, ölçüm tarafında metrik karıştırmanın maliyeti
- Source/Medium Debugging: First-Party Cookie ve Gerçek Kaynak, altyapının gerçek kaynağı nasıl gizlediği
- LLM Davranışsal Bozulma Modları, paraphrase ve kaynak kaymasının arkasındaki sistematik eğilimler
- LLM Temel Bozulma Modları, özetleme ve bağlam daralmasının tek-prompt ölçeğinde görünümü
Kaynaklar ve Referanslar
- Aggarwal, P. et al. “GEO: Generative Engine Optimization”, arXiv:2311.09735 (2024). Görünürlük ve citation’ı ayrı ele alan ilk akademik çerçeve; bu yazıdaki görünürlük/alıntı ayrımı bu çalışma ile uyumlu tanımlanmıştır.
- Pipeline metodoloji: Content Intelligence (DNOMIA), GSC + GA4 + crawl + GEO aracı birleşimi. Topic brief’ler cluster bazında hazırlanır, her prompt için hedef sayfa ve aksiyon eşleştirilir.
- YMYL trust-signal çerçevesi: Google Search Quality Evaluator Guidelines (E-E-A-T), güncel sürüm.
- llms.txt standardı (emerging): AI crawler’lara temiz markdown sunma önerisi, bu yazıdaki S1-S5 sinyallerini tamamlayıcı bir yapı katmanı.
- 01 GEO görünürlüğü ile LLM citation oranı aynı metrik değil; yüksek görünürlük citation garantisi vermiyor
- 02 Trust-signal checklist (schema, E-E-A-T, resmi kaynak) LLM eşiğini geçmek için gerekli ama alıntılanmayı tetiklemiyor
- 03 ~2.500+ sayfalık vakada visibility %96-100 olan cluster'ların büyük kısmında citation %0 ölçüldü
- 04 Citation Trigger Framework: tek cümlelik yanıt, sayısal öz, karşılaştırma iskeleti, orijinal veri, isimlendirilmiş çerçeve
- 05 Alıntılanan içeriğin ortak özelliği çıkarılabilir yapı; LLM hazır blok arıyor, açıklama değil
+ GEO ile SEO arasındaki temel fark nedir?
SEO klasik arama sonuçlarında sıralama hedefler. GEO (Generative Engine Optimization) ise ChatGPT, Perplexity, Gemini ve Google AI Overviews gibi üretken motorların cevabında kaynak olarak seçilmeyi ve alıntılanmayı hedefler. İki metriği ayırmak gerekir: görünürlük (LLM sayfayı dikkate aldı mı) ve citation (LLM sayfayı cevabında adladı mı).
+ Trust-signal checklist neden yetmiyor?
Schema markup, yazar kimliği, SSL ve resmi kaynak alıntısı LLM'in içeriği güvenilir saymasını sağlar ve görünürlük eşiğini geçirir. Ancak alıntılanma için model çıkarılabilir bir içerik bloğu arar. Checklist güven sinyali; citation'ı tetikleyen şey içerik yapısı.
+ Citation oranı nasıl ölçüldü?
İlgili kümeye ait ~50+ prompt GPT, Gemini ve Perplexity üzerinde sorgulandı. Model cevaplarında geçen ~8.200+ citation URL'si taranıp domain eşlemesi yapıldı. Sayfa başına görünürlük (model cevabında dikkate alınma oranı) ve citation (cevabın doğrudan alıntıladığı URL oranı) ayrı hesaplandı.
+ 50+ prompt istatistiksel olarak yeterli mi?
Prompt sayısı istatistiksel genelleme için değil, cluster düzeyinde sinyal tespiti için seçildi. ~200 cluster içinden yüksek trafik ve yüksek görünürlük filtresiyle ~50+ prompt'a indirildi. Bulgu cluster-spesifik örüntüyü ortaya koyar, evren tahmini yapmaz.
+ Bulgu bu dikey dışında geçerli mi?
Trust-signal eşiği YMYL dikeylerde (finans, sağlık, hukuk) daha sert ölçülür. Ancak görünürlük-citation ayrışması dikeyden bağımsız bir örüntü; LLM her dikeyde çıkarılabilir içerik arar. Bulgu diğer YMYL dikeylerine ve B2B SaaS içeriğine büyük olasılıkla taşınır, ölçüm her dikey için tekrar yapılmalı.
+ İçeriği citation için nasıl yeniden yapılandırmalı?
Citation Trigger Framework'ü uygula: ilk paragraf tek cümlede doğrudan yanıt, altında sayısal özet tablosu, ortada karşılaştırma iskeleti (X vs Y), bir bölüm orijinal veri veya vaka, ve bir yerde isimlendirilmiş bir çerçeve. Mevcut içeriği silmeden bu katmanları ekle.