Görünürlük Yüksek, Alıntı Sıfır: GEO'nun Görmezden Gelinen Boşluğu

TL;DR

GEO trust-signal checklist'i (schema, yazar kimliği, SSL, resmi kaynak alıntısı) gerekli ama yeterli değil. ~2.500+ sayfalık YMYL sitede ~50+ prompt ve ~8.200+ citation URL taramasıyla yapılan analiz, visibility %96-100 olan cluster'ların büyük kısmında citation oranının %0 kaldığını gösterdi. Checklist eşik geçişi için gerekli; alıntılanmayı tetikleyen ikinci katman ise içerik yapısı: tek cümlelik doğrudan yanıt, sayısal öz, karşılaştırma iskeleti, orijinal veri ve isimlendirilmiş çerçeve. Bu beş sinyali Citation Trigger Framework olarak derledim.

GA4 Attribution Raporları yazısında direct şişmesinin neden yanlış bir metrik olduğunu, Source/Medium Debugging yazısında ölçüm altyapısının gerçek kaynağı nasıl gizlediğini ele almıştım. Bu yazıda ölçüm problemini içerik stratejisine taşıyorum: GEO’da görünürlük ile alıntılanma farklı metrikler ve bunları karıştırmak bütçe yakan bir hata.

Direkt Yanıt

GEO trust-signal checklist’i LLM görünürlüğünün eşiğini geçirir, alıntılanmayı tetiklemez. Alıntılanan içerik iki katmana sahip: güven sinyalleri (schema, yazar, resmi kaynak) ve çıkarılabilir yapı (tek cümlelik yanıt, sayısal öz, karşılaştırma iskeleti, orijinal veri, isimlendirilmiş çerçeve). İkinci katman olmadan sayfa LLM cevabında görülür ama alıntılanmaz.

Vaka Özeti

Metrik	Değer
Taranan sayfa	~2.500+
Cluster	~200
İzlenen prompt	~50+
Citation URL taraması	~8.200+
Site eşleşmesi	~150
Gözlemlenen en dar ayrışma (bir cluster)	Visibility %96-100, Citation %0

Rakamlar yuvarlama ve aralık bildirimidir; domain-seviyesi eşleme ve prompt havuzu filtreleri sonrası gözlem değerleridir.

Site profili: Türkçe pazarda faaliyet gösteren, YMYL dikeyinde çalışan bir yayıncı, ~2.500+ yayımlanmış sayfa. Trust-signal seviyesi yüksek: yazar biyografileri, resmi kurum alıntıları, FAQPage ve Article schema, HTTPS, net tarih etiketleri. Checklist açısından ders niteliğinde.

Problem: Checklist Yanılgısı

Yaygın GEO önerileri şöyle: schema ekle, yazar bio yaz, SSL olmalı, resmi kaynağa bağlan, E-E-A-T sinyallerini güçlendir. Tümü doğru ve gerekli. Ama bu checklist tamamlandığında alıntılanmanın geldiğini iddia eden kaynak yok; yalnızca görünürlük eşiğinin geçildiği biliniyor.

GEO yazılarının büyük kısmı iki metriği birbirine karıştırıyor:

Visibility: LLM cevabını üretirken sayfayı değerlendirmeye aldı mı?
Citation: LLM cevabında sayfayı kaynak olarak adlandırdı mı veya doğrudan alıntıladı mı?

Bu iki metrik tek tabloya düştüğünde çıkan desen şaşırtıcı değil: görünürlük arttıkça citation otomatik artmıyor. Checklist’in ürettiği şey yalnızca birincisi.

Bulgu: Visibility %96-100, Citation %0

Söz konusu sitede ~200 cluster içinde yüksek trafikli ve yüksek görünürlüklü ~50+ prompt seçildi. GPT, Gemini ve Perplexity üzerinde sorgulandı. Cevaplardaki ~8.200+ citation URL’si tarandı, domain eşlemesi yapıldı.

Karşı örnek mevcut: aynı sitede 324 kelimelik bir sayfa ~49 citation aldı, 1.500+ kelimelik başka bir sayfa 0 citation aldı. Uzunluk tek başına belirleyici değil; belirleyici olan yapı.

Belirgin bir küme ortaya çıktı: visibility %96-100 bandında duran ve citation’ı sıfır olan cluster’lar. Yani LLM bu içerikleri görüyor, değerlendirmeye alıyor, cevabını şekillendirirken kullanıyor; ancak cevabın gösterdiği kaynak listesinde bu sayfalara yer vermiyor.

Ortak özellikleri:

Schema ve yazar kimliği eksiksiz
Resmi kurum alıntısı var
Konu otoritesi GSC verisinde net (binlerce impression, orta CTR)
İçerik uzun, ansiklopedik tonda, paragraf ağırlıklı
Tek cümlelik yanıt yok, sayısal tablo yok, karşılaştırma iskeleti yok
Özgün veri veya isimlendirilmiş çerçeve yok

Eksik olan şey güven değil, çıkarılabilirlik.

Neden Alıntılanmıyor

LLM cevap üretirken iki ayrı iş yapıyor: önce kimi sayfalara güvenileceğini eler (trust), sonra cevabın içine sığacak bir blok çeker (extract). Eleme aşamasında schema ve yazar sinyali belirleyici. Çekme aşamasında ise modelin içeri alabileceği, sıkıştırılmış bir birim gerekiyor.

Ansiklopedik paragraf bu birimi sunmuyor. Model o paragrafı okuyor, bilgiyi özümsüyor, kendi cümlesine dönüştürüyor ve kaynak olarak başka bir sayfa gösteriyor. Alıntı başka bir yere gidiyor çünkü başka sayfa modelin işini kolaylaştıran formatta yazılmış: tek satırda tanım, tabloda sayı, başlıkta karşılaştırma, bir yerde adı konmuş bir kavram.

Bu davranış modelin yapısal eğilimlerinden biri. LLM davranışsal bozulma modları yazısında bu eğilimlerin (özetleme bias’ı, kaynak kayması, paraphrase) neden ve nasıl oluştuğunu sistematik şekilde ele aldım; citation kaybı bu modların içerik stratejisine yansıyan yüzü.

Citation Trigger Framework

Citation’ı tetikleyen beş sinyal. Checklist’ten ayrı olarak, içeriğin yapısına dair sinyaller.

S1: Tek Cümlelik Doğrudan Yanıt

İlk paragrafta, ilk 50 kelime içinde, tek cümlede konunun cevabı. Bağlam değil, koşullu ifade değil, ısınma değil.

Yanlış: “Bu yazıda kredi kartı faiz hesaplamasının inceliklerini ele alacağız…”

Doğru: “Kredi kartı aylık faizi, bakiyenin günlük ortalamasına sözleşmeli oranın 30 güne uygulanmasıyla hesaplanır.”

Akademik dayanak: Aggarwal et al. (2024) quotation_addition yöntemiyle doğrudan alıntılanabilir ifadelerin citation oranını belirgin şekilde yükselttiğini ölçtü. İlk 50 kelime kısıtı SERP featured snippet pratiğinden gelen bir eşik; peer-reviewed bir kaynağa dayanmıyor.

S2: Sayısal Öz

İlk ekran içinde sayı barındıran tek bir tablo. Kaç tane, ne kadar, hangi aralıkta, hangi oran. LLM bu tabloyu olduğu gibi çekebilir.

Akademik dayanak: Aggarwal et al. (2024), test ettikleri 9 yöntem arasında statistics_addition müdahalesinin citation’ı en çok artıran yöntemlerden biri olduğunu raporladı (belirli sorgu tiplerinde +30-40% bandı).

S3: Karşılaştırma İskeleti

X vs Y, A ile B arasındaki fark, hangi durumda hangisi. LLM karşılaştırmalı sorularda (ki çoğu prompt böyle) doğrudan karşılaştırma barındıran sayfaya yönelir.

Akademik dayanak: Aggarwal et al. (2024) karşılaştırmalı query tipinde yapılandırılmış farklılaştırma içeren içeriğin tercih edildiğini gösterdi; cite_sources ve structure-focused müdahaleler bu sinyali destekliyor.

S4: Orijinal Veri veya Vaka

Başkasında olmayan bir sayı, bir vaka, bir ölçüm. Derivative içerik (başka kaynakları yeniden paketleyen sayfalar) LLM tarafından özümsenir ama kaynak gösterildiğinde alıntı başka siteye gider. Bu yazıdaki vakada 25+ citation alan sayfaların ortak özelliği, başka yerde bulunmayan orijinal veri bloğuydu (yapılandırılmış tablo, yaş-bazlı rehber, kurum kılavuzu özeti). Orijinal birim, alıntının sana gelmesini sağlayan şey.

Akademik dayanak: Google Search Quality Evaluator Guidelines E-E-A-T kriteri “original information, reporting, research” maddesini otorite sinyali olarak tanımlar. Helpful Content Update (2022-2024) dokümantasyonu orijinalliği ranking faktörü olarak açıklar.

S5: İsimlendirilmiş Çerçeve

“3 Adımlı X Yöntemi”, “Y Protokolü”, “Z Framework’ü”. İsmi olan kavramlar LLM için tekrar üretilebilir, yeniden sorgulandığında bulunabilir. İsimsiz akıl yürütme alıntılanmaz.

Dayanak: Bu sinyal ampirik bir gözlem, peer-reviewed akademik validasyonu yok. Content Intelligence pipeline’ında ~8.200+ citation URL taramasından çıkan örüntü: isimlendirilmiş çerçeveler ve spesifik terminoloji LLM cevaplarında daha sık geri üretiliyor ve kaynak atfı ile dönüyor. Sonraki ölçüm döngülerinde ayrı bir kontrollü test planlanıyor.

Checklist Hâlâ Gerekli mi

Evet. Trust-signal katmanı olmadan içerik görünürlük eşiğini geçemez ve Citation Trigger Framework devreye bile giremez. Çerçeve, checklist’in yerine geçmez; üstüne kurulur.

Sıralama şöyle:

Trust katmanı: schema, yazar, SSL, resmi kaynak, HTTPS, doğru tarih. Eksiği kapat.
Çıkarılabilirlik katmanı: Citation Trigger Framework’ün beş sinyali.

Eğer görünürlük düşükse birinci katman, görünürlük yüksek ama citation düşükse ikinci katman eksiktir.

Pratik Uygulama

Mevcut içeriği silmeden şu ekleri yap:

Her sayfanın başına tek cümlelik yanıt bloğu
Her sayfaya bir “Hızlı Referans” tablosu
Karşılaştırmalı sorguya aday sayfalara X vs Y iskeleti
En az bir orijinal sayı, bir vaka, bir ölçüm
Mümkünse site çapında bir isimlendirilmiş çerçeve (bu yazıda yaptığım gibi)

Ardından aynı prompt setini tekrar sorgula, citation oranını ölç. Eğer çerçeve çalışıyorsa citation sıfırdan düzenli bir orana çıkar.

Metodoloji Notu

Bu yazıdaki sayılar bir müşteri pipeline çalışmasının anonim özetidir. Sitenin adı, domain ve cluster başlıkları paylaşılmıyor; metodoloji ve sayı aralıkları paylaşılıyor.

Sorgulanan modeller: GPT, Gemini, Perplexity
Veri kaynakları: GSC (~180 gün aggregate), GA4 (~90 gün), site crawl, bir GEO aracı üzerinden prompt/citation takibi
Citation ölçümü URL ve domain düzeyinde eşleme ile yapıldı; paraphrase tespiti kapsam dışı
Cluster analizi: multilingual-e5-large embedding, log-normalized 6-boyutlu skorlama (trafik, SEO, etkileşim, güncellik, kalite, GEO)

Ölçümü yapan altyapı Content Intelligence: GSC, GA4, site crawl ve GEO aracı çıktısını tek bir pipeline’da birleştirip cluster bazlı topic brief üreten kendi aracım. Prompt-sayfa eşleşmesi, orphan tespiti, visibility/citation ayrışma haritası ve cluster-başı aksiyon planı otomatik çıkıyor. Bu yazıdaki Citation Trigger Framework, Content Intelligence çıktılarından türetilmiş bir çerçeve.

İlgili Yazılar

GA4 Attribution Raporları: Direct Şişmesi ve Model Seçimi, ölçüm tarafında metrik karıştırmanın maliyeti
Source/Medium Debugging: First-Party Cookie ve Gerçek Kaynak, altyapının gerçek kaynağı nasıl gizlediği
LLM Davranışsal Bozulma Modları, paraphrase ve kaynak kaymasının arkasındaki sistematik eğilimler
LLM Temel Bozulma Modları, özetleme ve bağlam daralmasının tek-prompt ölçeğinde görünümü

Kaynaklar ve Referanslar

Aggarwal, P. et al. “GEO: Generative Engine Optimization”, arXiv:2311.09735 (2024). Görünürlük ve citation’ı ayrı ele alan ilk akademik çerçeve; bu yazıdaki görünürlük/alıntı ayrımı bu çalışma ile uyumlu tanımlanmıştır.
Pipeline metodoloji: Content Intelligence (DNOMIA), GSC + GA4 + crawl + GEO aracı birleşimi. Topic brief’ler cluster bazında hazırlanır, her prompt için hedef sayfa ve aksiyon eşleştirilir.
YMYL trust-signal çerçevesi: Google Search Quality Evaluator Guidelines (E-E-A-T), güncel sürüm.
llms.txt standardı (emerging): AI crawler’lara temiz markdown sunma önerisi, bu yazıdaki S1-S5 sinyallerini tamamlayıcı bir yapı katmanı.

Önemli Noktalar

01 GEO görünürlüğü ile LLM citation oranı aynı metrik değil; yüksek görünürlük citation garantisi vermiyor
02 Trust-signal checklist (schema, E-E-A-T, resmi kaynak) LLM eşiğini geçmek için gerekli ama alıntılanmayı tetiklemiyor
03 ~2.500+ sayfalık vakada visibility %96-100 olan cluster'ların büyük kısmında citation %0 ölçüldü
04 Citation Trigger Framework: tek cümlelik yanıt, sayısal öz, karşılaştırma iskeleti, orijinal veri, isimlendirilmiş çerçeve
05 Alıntılanan içeriğin ortak özelliği çıkarılabilir yapı; LLM hazır blok arıyor, açıklama değil

Sık Sorulan Sorular (FAQ)

+ GEO ile SEO arasındaki temel fark nedir?

SEO klasik arama sonuçlarında sıralama hedefler. GEO (Generative Engine Optimization) ise ChatGPT, Perplexity, Gemini ve Google AI Overviews gibi üretken motorların cevabında kaynak olarak seçilmeyi ve alıntılanmayı hedefler. İki metriği ayırmak gerekir: görünürlük (LLM sayfayı dikkate aldı mı) ve citation (LLM sayfayı cevabında adladı mı).

+ Trust-signal checklist neden yetmiyor?

Schema markup, yazar kimliği, SSL ve resmi kaynak alıntısı LLM'in içeriği güvenilir saymasını sağlar ve görünürlük eşiğini geçirir. Ancak alıntılanma için model çıkarılabilir bir içerik bloğu arar. Checklist güven sinyali; citation'ı tetikleyen şey içerik yapısı.

+ Citation oranı nasıl ölçüldü?

İlgili kümeye ait ~50+ prompt GPT, Gemini ve Perplexity üzerinde sorgulandı. Model cevaplarında geçen ~8.200+ citation URL'si taranıp domain eşlemesi yapıldı. Sayfa başına görünürlük (model cevabında dikkate alınma oranı) ve citation (cevabın doğrudan alıntıladığı URL oranı) ayrı hesaplandı.

+ 50+ prompt istatistiksel olarak yeterli mi?

Prompt sayısı istatistiksel genelleme için değil, cluster düzeyinde sinyal tespiti için seçildi. ~200 cluster içinden yüksek trafik ve yüksek görünürlük filtresiyle ~50+ prompt'a indirildi. Bulgu cluster-spesifik örüntüyü ortaya koyar, evren tahmini yapmaz.

+ Bulgu bu dikey dışında geçerli mi?

Trust-signal eşiği YMYL dikeylerde (finans, sağlık, hukuk) daha sert ölçülür. Ancak görünürlük-citation ayrışması dikeyden bağımsız bir örüntü; LLM her dikeyde çıkarılabilir içerik arar. Bulgu diğer YMYL dikeylerine ve B2B SaaS içeriğine büyük olasılıkla taşınır, ölçüm her dikey için tekrar yapılmalı.

+ İçeriği citation için nasıl yeniden yapılandırmalı?

Citation Trigger Framework'ü uygula: ilk paragraf tek cümlede doğrudan yanıt, altında sayısal özet tablosu, ortada karşılaştırma iskeleti (X vs Y), bir bölüm orijinal veri veya vaka, ve bir yerde isimlendirilmiş bir çerçeve. Mevcut içeriği silmeden bu katmanları ekle.

content-strategy