AnasayfaspaceHaberlerspaceYazılarspaceForumspaceBilgilerspaceYazılımspaceLinklerspaceResimlerspaceSitemapspace

Merhaba Misafir, Forumlarımıza hoşgeldiniz.

Üye olmak için burayı tıklamanız yeterli. Kayıt işlemi ücretsiz olup, konulara cevap yazabilmeniz için gereklidir.
Hatırla
Parolanız
   
Forum
 Internet, WWW, Web, Network / WWW, WEB, Site kurulumu ve araçları
        robots.txt dosyası nedir, ne işe yarar?

robots.txt dosyası nedir, ne işe yarar?


30.09.2006 14:19

kEditor


Administrator
Aktif Üye

Mesaj sayısı 150
 27.02.2007, 00:08:44
Arama robotlarına sitenizin neresine bakması gerektiğini söyleyin
Arama motorlarının indeksleme robotları bir web sitesine ulaştıklarında ilk olarak kök dizinde bulunan robots.txt dosyasını ararlar. Bu dosya robotlara hangi sayfaların indekslenip hangilerinin indekslenmeyeceğini anlatmak için yerleştirilir. Robotlar sadece kök dizindeki robots.txt dosyasına bakacakları için alt dizinlere bu dosyayı yerleştirmek anlamsızdır. Eğer alt dizinlerden birisine ait url (veya url'lerin) indekslenmesini istemiyorsanız bunlar da kök dizindeki robots.txt dosyasında bildirmeniz gerekiyor. Ya da alternatif olarak indekslenmesini istemediğiniz sayfalarda Meta Tag kullanabilirsiniz. Çoğu ücretsiz blog servisi kök dizine erişime izin vermediğinden Meta Tag'lardan yararlanmak gerekecetir.



Örnek bir robots.txt adresi şu şekilde olmalıdır;



http://www.keditor.com/robots.txt



Aşağıdaki örneklerdeki robots.txt dosyaları ise, bulundukları hatalı pozisyon nedeni ile, robotlar tarafından dikkate alınmayacaklardır;



http://www.keditor.com/test/robots.txt



robots.txt dosyası sadece belirli bir şekilde düzenlenmiş metin içeriğine sahip olmalıdır ve asla HTML kodları içermemelidir. Aşağıdaki örnekleri inceleyelim.



Tüm robotların sitenizin tamamını indekslemesini engellemek için;



User-agent: *

Disallow: /



Sitenizin tamamının robotların birisi tarafından indekslenmesini engellemek için;



User-agent: Googlebot

Disallow: /

User-agent: *

Disallow:



Tüm robotların sitenizin tamamını indekslemesi için;



User-agent: *

Disallow:



Not: Boş bir robots.txt dosyası da aynı mesajı verecektir.

Bir dizinin tüm robotlar tarafından indekslenmesini engellemek için;



User-agent: *

Disallow: /dizin-adi/



Bir sayfanın tüm robotlar tarafından indekslenmesini engellemek için;



User-agent: *

Disallow: /dizin-adi/ozel-sayfa.html



Robots.txt dosyasında "/dizin-adi/*" veya "/dizin-adi/*.html" gibi ifadeler kullanamazsınız. Hariç tutulmasını istediğiniz sayfaları ve dizinleri teker teker belirtmek zorundasınız. Tabii ki hariç tuttuğunuz bir dizinin içindeki dosyaları ayrıca belirtmenize gerek yok :)



Örnek bir kod aşağıdaki şekilde olabilir;



# www.keditor.com için robots.txt dosyası

User-agent: *

Disallow: /cgi-bin/

Disallow: /images/private/

Disallow: /private.html



Bakılabilecek Kaynaklar:



www.robotstxt.org
Kullanıcı çevrimdışı Yazıcıya Gönder
 

Sayfayı yazdır  |  Önceki Konu  |  Sonraki Konu
Hızlı Menü
 




Forum istatistikleri
Konular:219, İletiler:276, Kullanıcılar:280
Aramıza en son katılan üyemiz, emrahh
Doğum Günü Olanlar
ad-dg (15)