dhosting.pldhosting.pl
  • Strona główna
  • Zacznij tutaj
  • Kategorie
    • Hosting
    • Poczta
    • Domeny
    • Faktury i płatności
    • Pozostałe
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
  • Strona główna
  • Zacznij tutaj
  • Kategorie
    • Hosting
    • Poczta
    • Domeny
    • Faktury i płatności
    • Pozostałe
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
Strona główna/Baza wiedzy/Hosting/Strony WWW

Jak korzystać z pliku robots.txt?

514 wyświetleń 0

Autor: Jan Elastyczny
16.06.2021

Czym jest plik robots.txt?

Plik ten określa zestaw reguł wyłącznie dla robotów indeksujących, które nie mają wpływu na działanie strony WWW w przeciwieństwie do tych zawartych w pliku .htaccess gdzie również można przykładowo określić możliwość dostępu lub zablokować go dla wybranych robotów. Plik robots.txt ułatwia tę kwestię, eliminując jednocześnie ryzyko zablokowania dostępu użytkownikom odwiedzającym Twoją stronę WWW.

Oczywiście to przy założeniu, że dane roboty indeksujące, które odwiedzają Twoją stronę, odczytują i respektują zawarte w tym pliku reguły.
TUTAJ znajdziesz listę popularnych botów wraz z informacją jakimi nazwami agentów się identyfikują.

Przykładowa składnia

User-agent: [nazwa agenta]
Disallow: [Ścieżka URL, która nie ma być skanowana]

User-agent: [nazwa agenta]
Allow: [Ścieżka URL, która ma być skanowana]

Sitemap: [URL do pliku XML zawierającego mapę strony (Sitemap)]

Gdzie powinieneś zamieścić plik robotx.txt?

Plik ten powinien znaleźć się w głównym katalogu Twojej strony WWW, a więc domyślnie po połączeniu się z serwerem FTP będzie to ścieżka o postaci: nazwadomeny/public_html

Informację w jaki sposób połączyć się z serwerem FTP aby utworzyć lub wgrać przygotowany wcześniej plik na przykładzie klienta „WinSCP”, znajdziesz TUTAJ.

Poniżej przedstawiamy jedną z zalecanych konstrukcji pliku robots.txt z przeznaczeniem dla stron WWW opartych o „WordPress”.

User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /refer/

Sitemap: http://www.twojadomena.pl/post-sitemap.xml
Sitemap: http://www.twojadomena.pl/page-sitemap.xml

Jak zapewne zwróciłeś uwagę, na końcu plik zawiera adresy do tzw. map stron, a konkretniej bazując na przykładzie do mapy postów (wpisów) oraz stron dla serwisu WWW opartego o „WordPress” – TUTAJ znajdziesz więcej informacji jakiej wtyczki użyć aby wygenerować mapę strony.

Tags:roboty indeksującejak korzystać z pliku robots.txtpolski hostingweb hostinghostingrobots.txtplik robotsreguły w pliku robots

Czy ten artykuł był pomocy?

Tak  Nie
Powiązane artykuły
  • Jak zamienić stronę firmową w maszynę do generowania zapytań
  • Najczęstsze błędy na stronach firm – co psuje zaufanie klientów
  • Jak rozwiązać najczęstsze problemy z rozszerzeniami Joomla
  • Jak ustawić podstawowe SEO w Joomla
  • Podstawy bezpieczeństwa Joomla – jak chronić stronę
  • Jak wykonać kopię zapasową Joomla i ją przywrócić
Elastyczny Web Hosting
Fachowe poradniki
  • Drzewo kategorii i tagi – jak zarządzać strukturą serwisu contentowego
  • Headless CMS – WordPress jako backend Twojego serwisu
  • Jak stworzyć wtyczkę do WordPressa? Poradnik dla początkujących
  • Jak założyć bloga? Kompletny przewodnik instalacji WordPressa dla początkujących
  • Jekyll, generator stron statycznych, alternatywą dla WordPressa
  • Tailwind CSS – utility-first framework alternatywą dla Bootstrap
  • Vue.js jako wtyczka do WordPressa
  • Wielojęzyczna strona w WordPressie bez użycia wtyczek – jak ją stworzyć?
  • WordPress MultiSite – omówienie, instalacja oraz konfiguracja
Strony WWW
  • Jak korzystać z pliku robots.txt?
  • Jak zamienić stronę firmową w maszynę do generowania zapytań
  • Najczęstsze błędy na stronach firm – co psuje zaufanie klientów
  • Co powinna zawierać dobra strona firmowa, żeby budować zaufanie
  • Dlaczego warto mieć stronę WWW jako firma
  • WordPress: jak przekierować 404 na stronę główną w .htaccess
Pokaż wszystko 172  
Najpopularniejsze
  • W jaki sposób skonfigurować program pocztowy?
  • Czym różni się CC od BCC podczas wysyłania wiadomości e-mail?
  • Jak wykonać polecenie traceroute w systemie Windows?
  • Najpopularniejsze kody Minecraft i jak ich używać
  • Co to jest symlink i jak go utworzyć?
Kategorie
  • Microsoft
    • Office
  • Domeny
    • Registry Lock
    • Rejestracja i odnowienia domen
    • Transfery domen
    • Zarządzanie domenami w dPanelu
    • Inne
  • Faktury i płatności
    • Faktury VAT
    • Inne
    • Metody i płatności
    • Problemy z płatnością
    • RODO
    • Zarządzanie fakturami i płatnościami w dPanelu
  • Płatności on-line
    • Tpay
  • Hosting
    • Problemy z działaniem stron WWW
    • Redis
    • Rodzaje błędów HTTP
    • SSH
    • Serwery
    • Strony WWW
    • Migracja
    • Zacznij tutaj
    • Aplikacje internetowe (CMS
    • Bazy danych
    • SWH
    • Certyfikaty SSL
    • Cloudflare
    • CRON
    • Inne
    • Elastyczny Web Hosting
    • Kooperacja
    • FTP
    • dKonta / dVPS
    • Operacje PHP
  • Poczta
    • Aliasy pocztowe
    • Filtry antyspamowe
    • Problemy z odbiorem wiadomości
    • Gmail
    • Problemy z wysyłką wiadomości
    • Konfiguracja programów pocztowych
    • Webmail dPoczta.pl
    • Zarządzanie pocztą w dPanelu
    • Migracja skrzynek
  • Kalendarz
  • Pozostałe
    • Inne
    • Szablony Wordpress
    • Szablony Prestashop
    • Kryptowaluty
    • Komunikatory dla firm
    • Mailing
    • eCommerce
    • SEO
    • Wideo
    • Frameworki
    • Wtyczki Wordpress
    • Zarządzanie skalowaniem
    • Program Partnerski
    • Bezpieczeństwo
    • Moduły Prestashop
    • Zarządzanie kontem
    • Rozszerzenia Joomla
  • Strona główna
  • Zacznij tutaj
  • Status usług
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
  • Copyright © 2025 dhosting.pl Sp. z o.o.