dhosting.pldhosting.pl
  • Strona główna
  • Zacznij tutaj
  • Kategorie
    • Hosting
    • Poczta
    • Domeny
    • Faktury i płatności
    • Pozostałe
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
  • Strona główna
  • Zacznij tutaj
  • Kategorie
    • Hosting
    • Poczta
    • Domeny
    • Faktury i płatności
    • Pozostałe
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
Strona główna/Baza wiedzy/Hosting/Strony WWW

Jak korzystać z pliku robots.txt?

368 wyświetleń 0

Autor: Jan Elastyczny
16.06.2021

Czym jest plik robots.txt?

Plik ten określa zestaw reguł wyłącznie dla robotów indeksujących, które nie mają wpływu na działanie strony WWW w przeciwieństwie do tych zawartych w pliku .htaccess gdzie również można przykładowo określić możliwość dostępu lub zablokować go dla wybranych robotów. Plik robots.txt ułatwia tę kwestię, eliminując jednocześnie ryzyko zablokowania dostępu użytkownikom odwiedzającym Twoją stronę WWW.

Oczywiście to przy założeniu, że dane roboty indeksujące, które odwiedzają Twoją stronę, odczytują i respektują zawarte w tym pliku reguły.
TUTAJ znajdziesz listę popularnych botów wraz z informacją jakimi nazwami agentów się identyfikują.

Przykładowa składnia

User-agent: [nazwa agenta]
Disallow: [Ścieżka URL, która nie ma być skanowana]

User-agent: [nazwa agenta]
Allow: [Ścieżka URL, która ma być skanowana]

Sitemap: [URL do pliku XML zawierającego mapę strony (Sitemap)]

Gdzie powinieneś zamieścić plik robotx.txt?

Plik ten powinien znaleźć się w głównym katalogu Twojej strony WWW, a więc domyślnie po połączeniu się z serwerem FTP będzie to ścieżka o postaci: nazwadomeny/public_html

Informację w jaki sposób połączyć się z serwerem FTP aby utworzyć lub wgrać przygotowany wcześniej plik na przykładzie klienta „WinSCP”, znajdziesz TUTAJ.

Poniżej przedstawiamy jedną z zalecanych konstrukcji pliku robots.txt z przeznaczeniem dla stron WWW opartych o „WordPress”.

User-Agent: *
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /wp-admin/
Disallow: /readme.html
Disallow: /refer/

Sitemap: http://www.twojadomena.pl/post-sitemap.xml
Sitemap: http://www.twojadomena.pl/page-sitemap.xml

Jak zapewne zwróciłeś uwagę, na końcu plik zawiera adresy do tzw. map stron, a konkretniej bazując na przykładzie do mapy postów (wpisów) oraz stron dla serwisu WWW opartego o „WordPress” – TUTAJ znajdziesz więcej informacji jakiej wtyczki użyć aby wygenerować mapę strony.

Tags:hostingjak korzystać z pliku robots.txtplik robotspolski hostingreguły w pliku robotsrobots.txtroboty indeksująceweb hosting

Czy ten artykuł był pomocy?

Tak  Nie
Powiązane artykuły
  • Staging a SEO – jak testować zmiany bez szkody dla widoczności
  • Jak zabezpieczyć środowisko staging przed dostępem i indeksacją
  • Czy staging potrzebny jest każdej stronie internetowej?
  • Co to jest staging?
  • Jak utworzyć środowisko staging dla sklepu PrestaShop
  • Co to są Enhanced Conversions i jak je wdrożyć w WordPressie?
Elastyczny Web Hosting
Fachowe poradniki
  • Drzewo kategorii i tagi – jak zarządzać strukturą serwisu contentowego
  • Headless CMS – WordPress jako backend Twojego serwisu
  • Jak stworzyć wtyczkę do WordPressa? Poradnik dla początkujących
  • Jak założyć bloga? Kompletny przewodnik instalacji WordPressa dla początkujących
  • Jekyll, generator stron statycznych, alternatywą dla WordPressa
  • Tailwind CSS – utility-first framework alternatywą dla Bootstrap
  • Vue.js jako wtyczka do WordPressa
  • Wielojęzyczna strona w WordPressie bez użycia wtyczek – jak ją stworzyć?
  • WordPress MultiSite – omówienie, instalacja oraz konfiguracja
Strony WWW
  • Jak korzystać z pliku robots.txt?
  • Jak przesłać pliki poprzez FTP używając aplikacji FileZilla?
  • Client Side Rendering – czym jest i jak działa renderowanie po stronie klienta?
  • Static Site Generation – czym jest i kiedy warto z niego korzystać?
  • Server Side Rendering (SSR) – czym jest renderowanie po stronie serwera i kiedy warto je stosować?
  • Edycja i personalizacja szablonów e-mail w PrestaShop
Pokaż wszystko 151  
Najpopularniejsze
  • W jaki sposób skonfigurować program pocztowy?
  • Czym różni się CC od BCC podczas wysyłania wiadomości e-mail?
  • Jak wykonać polecenie traceroute w systemie Windows?
  • Najpopularniejsze kody Minecraft i jak ich używać
  • Co to jest symlink i jak go utworzyć?
Kategorie
  • Pozostałe
    • Frameworki
    • Program Partnerski
    • Bezpieczeństwo
    • Zarządzanie kontem
    • Inne
    • Kryptowaluty
    • Komunikatory dla firm
    • Mailing
    • eCommerce
    • SEO
    • Wideo
  • Microsoft
    • Office
  • Domeny
    • Inne
    • Registry Lock
    • Rejestracja i odnowienia domen
    • Transfery domen
    • Zarządzanie domenami w dPanelu
  • Faktury i płatności
    • Faktury VAT
    • Inne
    • Metody i płatności
    • Problemy z płatnością
    • RODO
    • Zarządzanie fakturami i płatnościami w dPanelu
  • Hosting
    • CRON
    • Inne
    • Elastyczny Web Hosting
    • Kooperacja
    • FTP
    • dKonta / dVPS
    • Operacje PHP
    • Problemy z działaniem stron WWW
    • Redis
    • Rodzaje błędów HTTP
    • SSH
    • Serwery
    • Strony WWW
    • Migracja
    • Zacznij tutaj
    • Aplikacje internetowe (CMS
    • Bazy danych
    • SWH
    • Certyfikaty SSL
    • Cloudflare
  • Poczta
    • Webmail dPoczta.pl
    • Zarządzanie pocztą w dPanelu
    • Migracja skrzynek
    • Aliasy pocztowe
    • Filtry antyspamowe
    • Problemy z odbiorem wiadomości
    • Gmail
    • Problemy z wysyłką wiadomości
    • Konfiguracja programów pocztowych
  • Kalendarz
  • Strona główna
  • Zacznij tutaj
  • Status usług
  • Fachowe poradniki
  • Helpdesk 24h
  • Elastyczny Web Hosting →
  • Copyright © 2023 dhosting.pl Sp. z o.o.