robots.txt Tester — Ücretsiz robots.txt Analiz & Test Aracı

Question 1

robots.txt nedir ve ne işe yarar?

Answer

robots.txt, web sunucunuzun kök dizininde (/robots.txt) bulunan ve arama motoru botlarına (Googlebot, Bingbot vb.) hangi sayfaların taranabileceğini bildiren düz metin dosyasıdır. Robots Exclusion Protocol standardına dayanır ve 1994'ten bu yana kullanılmaktadır. Crawl bütçesini yönetmek, yinelenen içerikleri taramadan dışlamak ve yönetim paneli gibi hassas bölümleri botlardan gizlemek için kullanılır.

Question 2

robots.txt olmayan bir sitede ne olur?

Answer

robots.txt dosyası bulunamadığında (HTTP 404) arama motoru botları tüm sayfaları taramaya yetkili olduğunu varsayar. Küçük ve düzenli içerikli siteler için bu genellikle sorun teşkil etmez. Ancak büyük sitelerde gereksiz sayfa taranması crawl bütçesini tüketebilir. Yönetim panelleriniz, test ortamlarınız veya kopyalanmış içerik sayfalarınız varsa bir robots.txt oluşturmanız önerilir.

Question 3

robots.txt SEO'yu doğrudan etkiler mi?

Answer

Evet, önemli ölçüde. Arama motorları, büyük siteler için günlük tarayabileceği sayfa sayısını sınırlandıran 'crawl bütçesi' kavramını kullanır. Gereksiz sayfaları (filtre URL'leri, kopya içerikler, yönetim arayüzleri) robots.txt ile taramadan çıkarmak, bütçenin değerli sayfalara ayrılmasını sağlar ve dolaylı olarak sıralama sürecini hızlandırır. Öte yandan kritik sayfaların yanlışlıkla engellenmesi tam bir SEO felaketine dönüşebilir.

Question 4

Disallow ile bir sayfanın indekslenmesini önleyebilir miyim?

Answer

Hayır — bu kritik bir yanılgıdır. Disallow, botların sayfayı taramasını engeller ama indekslenmesini garanti etmez. Başka sitelerden gelen backlinkler sayesinde Google sayfanın varlığından haberdar olabilir ve URL'yi indeksleyebilir (içeriğini bilmese bile). Bir sayfanın arama sonuçlarında hiç görünmemesini istiyorsanız <meta name='robots' content='noindex'> kullanın veya HTTP yanıt başlığına X-Robots-Tag: noindex ekleyin.

Question 5

Allow ve Disallow çakışırsa hangisi kazanır?

Answer

Google'ın algoritmasına göre daha uzun eşleşen kural her zaman önceliklidir. Örneğin Disallow: /admin/ ve Allow: /admin/public/ kuralları varken /admin/public/index.html isteğinde Allow kazanır çünkü daha uzun bir yolu kapsar. Eşit uzunlukta kural çakışmasında Allow önceliklidir. Bu araç da bu algoritmayı kullanarak URL test sonuçlarını hesaplar.

Question 6

Googlebot robots.txt kurallarına uymak zorunda mı?

Answer

robots.txt teknik bir kısıtlama değil, uyumu gönüllü bir 'centilmenlik anlaşması'dır. Google, Bing, Yandex gibi köklü arama motorları Robots Exclusion Protocol'e uyar. Ancak kötü niyetli botlar bu kuralları tamamen görmezden gelebilir. Dolayısıyla robots.txt hassas verileri korumak için yeterli bir güvenlik mekanizması değildir; gerçek koruma için kimlik doğrulama veya IP kısıtlaması gerekir.

Question 7

robots.txt içinde joker karakter (*) ve $ nasıl çalışır?

Answer

* (yıldız işareti) herhangi bir karakter dizisiyle eşleşir. Örneğin Disallow: /*.pdf$ tüm .pdf uzantılı URL'leri engeller. $ ise URL'nin sonunu işaret eder; Disallow: /admin$ yalnızca /admin URL'sini engeller, /admin/panel gibi alt yolları engellemez. Karmaşık örüntüler oluştururken bu iki karakteri birleştirebilirsiniz.

Question 8

Crawl-delay direktifi Googlebot'u etkiler mi?

Answer

Hayır, Google Crawl-delay direktifini resmi olarak desteklemez ve görmezden gelir. Googlebot'un tarama hızını kontrol etmek için Google Search Console'daki 'Tarama Hızı' ayarını kullanmalısınız. Bing ve Yandex Crawl-delay'i destekler. Sunucu yükünü azaltmak istiyorsanız Search Console'da Googlebot için tarama hızını manuel olarak sınırlayabilirsiniz.

Question 9

Birden fazla User-agent için ayrı kurallar tanımlayabilir miyim?

Answer

Evet. Her User-agent bloğu bağımsız çalışır. Önce User-agent: * ile genel kurallarınızı tanımlayın, ardından User-agent: Googlebot gibi özel bloklarla belirli botlara farklı kurallar uygulayabilirsiniz. Belirli bir bot için tanımlanmış kural varsa Google o botu için özel kuralı, bulamazsa wildcard (*) kuralını uygular — ikisini birleştirmez.

Question 10

Bu araç ücretsiz mi, kayıt gerekiyor mu?

Answer

Evet, tamamen ücretsizdir ve kayıt gerektirmez. Araç, hedef sitenin /robots.txt adresini sunucu tarafında gerçek zamanlı olarak getirir, Google'ın robots.txt spesifikasyonundaki en uzun eşleşme algoritmasıyla kuralları ayrıştırır ve URL test sonuçlarını hesaplar. Yaptığınız sorgular sunucularımızda saklanmaz.

Web Hizmetleri

robots.txt Tester — Ücretsiz robots.txt Analiz & Test Aracı

robots.txt Analizini Başlatın

Arama Motoru Botlarını Yönlendiren Dosya

robots.txt Direktifleri ve Sözdizimi

robots.txt'te Sık Yapılan Yanlışlar

robots.txt İçin 4 Altın Kural

Önce Wildcard (*), Sonra Özel Bot

Sitemap Bildirin

Sondaki / Karakterine Dikkat

Değişikliklerden Sonra Test Edin

Sıkça Sorulan Sorular