{"id":16190,"date":"2026-06-19T14:10:34","date_gmt":"2026-06-19T12:10:34","guid":{"rendered":"https:\/\/dhosting.pl\/pomoc\/?post_type=manual_kb&#038;p=16190"},"modified":"2026-06-19T14:10:34","modified_gmt":"2026-06-19T12:10:34","slug":"jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www","status":"publish","type":"manual_kb","link":"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/","title":{"rendered":"Jak w uniwersalny spos\u00f3b blokowa\u0107 boty AI i LLM na stronie WWW"},"content":{"rendered":"<p>Blokowanie bot\u00f3w AI polega na po\u0142\u0105czeniu kilku warstw ochrony: pliku robots.txt, metatag\u00f3w i nag\u0142\u00f3wk\u00f3w HTTP, nowych standard\u00f3w takich jak TDMRep oraz filtr\u00f3w po stronie serwera lub us\u0142ug typu Cloudflare. Dzi\u0119ki takiemu podej\u015bciu zatrzymasz grzeczne crawlery modeli j\u0119zykowych, kt\u00f3re przestrzegaj\u0105 standard\u00f3w, i dodatkowo utrudnisz dzia\u0142anie agresywnym scraperom.<\/p>\n<div id=\"ez-toc-container\" class=\"ez-toc-v2_0_85 ez-toc-wrap-left counter-flat ez-toc-counter ez-toc-custom ez-toc-container-direction\">\n<div class=\"ez-toc-title-container\">\n<p class=\"ez-toc-title\" style=\"cursor:inherit\">Spis tre\u015bci<\/p>\n<span class=\"ez-toc-title-toggle\"><\/span><\/div>\n<nav><ul class='ez-toc-list ez-toc-list-level-1 ' ><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-1\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Warstwa_1_%E2%80%93_robotstxt_dla_znanych_botow_AI\" >Warstwa 1 \u2013 robots.txt dla znanych bot\u00f3w AI<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-2\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Warstwa_2_%E2%80%93_meta_tagi_i_naglowki_noai\" >Warstwa 2 \u2013 meta tagi i nag\u0142\u00f3wki noai<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-3\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Warstwa_3_%E2%80%93_TDMRep_llmstxt_i_aitxt\" >Warstwa 3 \u2013 TDMRep, llms.txt i ai.txt<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-4\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Warstwa_4_%E2%80%93_blokada_na_serwerze_i_w_Cloudflare\" >Warstwa 4 \u2013 blokada na serwerze i w Cloudflare<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-5\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Warstwa_5_%E2%80%93_regulamin_paywall_i_dostep_warunkowy\" >Warstwa 5 \u2013 regulamin, paywall i dost\u0119p warunkowy<\/a><\/li><li class='ez-toc-page-1'><a class=\"ez-toc-link ez-toc-heading-6\" href=\"https:\/\/dhosting.pl\/pomoc\/baza-wiedzy\/jak-w-uniwersalny-sposob-blokowac-boty-ai-i-llm-na-stronie-www\/#Od_czego_zaczac_w_praktyce\" >Od czego zacz\u0105\u0107 w praktyce<\/a><\/li><\/ul><\/nav><\/div>\n<h2><span class=\"ez-toc-section\" id=\"Warstwa_1_%E2%80%93_robotstxt_dla_znanych_botow_AI\"><\/span>Warstwa 1 \u2013 robots.txt dla znanych bot\u00f3w AI<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Podstawowym narz\u0119dziem komunikacji z botami jest plik robots.txt w katalogu g\u0142\u00f3wnym witryny. To w nim mo\u017cesz zdefiniowa\u0107 regu\u0142y blokuj\u0105ce konkretne crawlery AI, na przyk\u0142ad GPTBot, ClaudeBot czy PerplexityBot. Taki zapis dzia\u0142a na boty, kt\u00f3re respektuj\u0105 standard robots.txt, czyli na wi\u0119kszo\u015b\u0107 du\u017cych dostawc\u00f3w modeli.<\/p>\n<p>Przyk\u0142adowy fragment pliku robots.txt blokuj\u0105cy wybrane boty AI mo\u017ce wygl\u0105da\u0107 tak:<\/p>\n<pre><code class=\"\" data-line=\"\">User-agent: GPTBot\nDisallow: \/\n\nUser-agent: ChatGPT-User\nDisallow: \/\n\nUser-agent: OAI-SearchBot\nDisallow: \/\n\nUser-agent: ClaudeBot\nDisallow: \/\n\nUser-agent: PerplexityBot\nDisallow: \/\n\nUser-agent: *\nDisallow:\n<\/code><\/pre>\n<p>Dzi\u0119ki takiej konfiguracji wskazane boty AI nie powinny wchodzi\u0107 na Twoj\u0105 stron\u0119, natomiast pozosta\u0142e roboty mog\u0105 mie\u0107 nadal pe\u0142ny dost\u0119p, je\u015bli tego potrzebujesz.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Warstwa_2_%E2%80%93_meta_tagi_i_naglowki_noai\"><\/span>Warstwa 2 \u2013 meta tagi i nag\u0142\u00f3wki noai<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Sama blokada w robots.txt nie m\u00f3wi jeszcze wprost, \u017ce nie \u017cyczysz sobie wykorzystywania tre\u015bci do trenowania modeli. Coraz popularniejsze staj\u0105 si\u0119 metatagi oraz nag\u0142\u00f3wki X-Robots-Tag z dyrektyw\u0105 noai i noimageai. To dodatkowy sygna\u0142 dla narz\u0119dzi i crawler\u00f3w powi\u0105zanych z AI, \u017ce nie zgadzasz si\u0119 na takie u\u017cycie zawarto\u015bci.<\/p>\n<p>Aby zastosowa\u0107 to rozwi\u0105zanie globalnie, mo\u017cesz doda\u0107 w sekcji head szablonu WordPressa metatag w takiej postaci:<\/p>\n<pre><code class=\"\" data-line=\"\">&lt;meta name=&quot;robots&quot; content=&quot;noai, noimageai&quot;&gt;\n<\/code><\/pre>\n<p>Je\u017celi chcesz zastrzec tylko cz\u0119\u015b\u0107 serwisu, na przyk\u0142ad katalog z materia\u0142ami premium, mo\u017cesz u\u017cy\u0107 nag\u0142\u00f3wka X-Robots-Tag po stronie serwera. W przypadku Nginx przyk\u0142adowa konfiguracja mo\u017ce wygl\u0105da\u0107 tak:<\/p>\n<pre><code class=\"\" data-line=\"\">location \/premium\/ {\n    add_header X-Robots-Tag &quot;noai, noimageai&quot; always;\n}\n<\/code><\/pre>\n<p>Dzi\u0119ki temu \u017c\u0105dania do katalogu premium b\u0119d\u0105 zawsze otrzymywa\u0142y nag\u0142\u00f3wek zabraniaj\u0105cy wykorzystania tre\u015bci w treningu modeli AI.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Warstwa_3_%E2%80%93_TDMRep_llmstxt_i_aitxt\"><\/span>Warstwa 3 \u2013 TDMRep, llms.txt i ai.txt<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>W ostatnich latach rozwijane s\u0105 standardy u\u0142atwiaj\u0105ce zg\u0142aszanie sprzeciwu wobec text and data mining, czyli masowego przetwarzania tre\u015bci przez narz\u0119dzia i modele AI. Jednym z nich jest protok\u00f3\u0142 TDMRep, kt\u00f3ry wykorzystuje prosty metatag i nag\u0142\u00f3wek HTTP, aby poinformowa\u0107, \u017ce w\u0142a\u015bciciel nie zgadza si\u0119 na tego typu wykorzystanie danych.<\/p>\n<p>Przyk\u0142adowy metatag TDMRep mo\u017ce wygl\u0105da\u0107 tak:<\/p>\n<pre><code class=\"\" data-line=\"\">&lt;meta name=&quot;tdm-reservation&quot; content=&quot;1&quot;&gt;\n<\/code><\/pre>\n<p>Analogicznie mo\u017cesz doda\u0107 nag\u0142\u00f3wek HTTP:<\/p>\n<pre><code class=\"\" data-line=\"\">TDM-Reservation: 1\n<\/code><\/pre>\n<p>R\u00f3wnolegle pojawiaj\u0105 si\u0119 pliki llms.txt i ai.txt, kt\u00f3re dzia\u0142aj\u0105 podobnie jak robots.txt, ale pozwalaj\u0105 okre\u015bli\u0107 nie tylko dost\u0119p, lecz tak\u017ce cel u\u017cycia tre\u015bci. W takich plikach mo\u017cesz wyszczeg\u00f3lni\u0107, kt\u00f3rym dostawcom AI wolno pobiera\u0107 tre\u015bci oraz w jakim zakresie.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Warstwa_4_%E2%80%93_blokada_na_serwerze_i_w_Cloudflare\"><\/span>Warstwa 4 \u2013 blokada na serwerze i w Cloudflare<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Niestety nie wszystkie boty przestrzegaj\u0105 robots.txt i metatag\u00f3w, dlatego warto do\u0142o\u017cy\u0107 tward\u0105 blokad\u0119 po stronie serwera lub dostawcy CDN. Przyk\u0142adowo w panelu Cloudflare mo\u017cesz w\u0142\u0105czy\u0107 w sekcji Security odpowiedni\u0105 regu\u0142\u0119 blokuj\u0105c\u0105 znane boty AI, co od razu odfiltruje cz\u0119\u015b\u0107 ruchu.<\/p>\n<p>Je\u015bli korzystasz z serwera Apache, mo\u017cesz u\u017cy\u0107 pliku .htaccess, aby zwr\u00f3ci\u0107 b\u0142\u0105d 403 dla wybranych user agent\u00f3w. Przyk\u0142adowa regu\u0142a wygl\u0105da tak:<\/p>\n<pre><code class=\"\" data-line=\"\">RewriteEngine On\n\nRewriteCond %{HTTP_USER_AGENT} GPTBot [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ChatGPT-User [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} OAI-SearchBot [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} ClaudeBot [NC,OR]\nRewriteCond %{HTTP_USER_AGENT} PerplexityBot [NC]\nRewriteRule .* - [F,L]\n<\/code><\/pre>\n<p>Podobne regu\u0142y mo\u017cna zdefiniowa\u0107 w konfiguracji Nginx, co pozwala skutecznie zatrzyma\u0107 ruch z okre\u015blonych bot\u00f3w AI, niezale\u017cnie od ich reakcji na robots.txt.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Warstwa_5_%E2%80%93_regulamin_paywall_i_dostep_warunkowy\"><\/span>Warstwa 5 \u2013 regulamin, paywall i dost\u0119p warunkowy<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Ostatnia warstwa dotyczy nie tyle konfiguracji technicznej, co zasad korzystania z tre\u015bci. Warto w regulaminie oraz polityce praw autorskich jasno zapisa\u0107, \u017ce nie wyra\u017casz zgody na wykorzystywanie tre\u015bci serwisu w treningu modeli AI i masowym scrapowaniu. Taki zapis nie zatrzyma bot\u00f3w sam w sobie, ale tworzy dodatkow\u0105 podstaw\u0119 prawn\u0105 do dzia\u0142ania, je\u015bli kto\u015b zignoruje Twoje dyrektywy.<\/p>\n<p>W przypadku szczeg\u00f3lnie cennych lub wra\u017cliwych tre\u015bci mo\u017cesz te\u017c rozwa\u017cy\u0107 ich udost\u0119pnianie wy\u0142\u0105cznie po zalogowaniu, w modelu subskrypcyjnym lub za paywallem. Wi\u0119kszo\u015b\u0107 bot\u00f3w nie przechodzi przez takie zabezpieczenia, dzi\u0119ki czemu nie ma technicznej mo\u017cliwo\u015bci pobrania pe\u0142nych materia\u0142\u00f3w.<\/p>\n<h2><span class=\"ez-toc-section\" id=\"Od_czego_zaczac_w_praktyce\"><\/span>Od czego zacz\u0105\u0107 w praktyce<span class=\"ez-toc-section-end\"><\/span><\/h2>\n<p>Najlepsze efekty przynosi podej\u015bcie warstwowe. Na pocz\u0105tek zadbaj o aktualny plik robots.txt z regu\u0142ami dla znanych bot\u00f3w AI. Nast\u0119pnie dodaj w szablonie metatag noai i noimageai albo odpowiednie nag\u0142\u00f3wki X-Robots-Tag dla wybranych katalog\u00f3w. Kolejnym krokiem mo\u017ce by\u0107 wdro\u017cenie TDMRep oraz, w miar\u0119 rozwoju standard\u00f3w, plik\u00f3w llms.txt i ai.txt.<\/p>\n<p>R\u00f3wnolegle w\u0142\u0105cz filtrowanie ruchu w narz\u0119dziach takich jak Cloudflare lub skonfiguruj proste regu\u0142y w .htaccess. Ca\u0142o\u015b\u0107 warto uzupe\u0142ni\u0107 jasnym regulaminem i przemy\u015blanym modelem dost\u0119pu do najbardziej warto\u015bciowych tre\u015bci. Taki zestaw nie gwarantuje pe\u0142nej ochrony, ale istotnie utrudnia masowe scrapowanie zawarto\u015bci przez boty AI.<\/p>\n","protected":false},"author":6,"featured_media":10957,"parent":0,"menu_order":0,"template":"","format":"standard","manualknowledgebasecat":[121,118],"manual_kb_tag":[7535,7531,7536,7520,7521,7524,7532,7523,7530,7526,7527,7533,7525,7522,7534,7529,7528],"class_list":["post-16190","manual_kb","type-manual_kb","status-publish","format-standard","has-post-thumbnail","hentry","manualknowledgebasecat-inne","manualknowledgebasecat-pozostale","manual_kb_tag-htaccess-blokada-botow","manual_kb_tag-ai-txt","manual_kb_tag-bezpieczenstwo-strony-www","manual_kb_tag-blokowanie-botow-ai","manual_kb_tag-blokowanie-llm","manual_kb_tag-claudebot","manual_kb_tag-cloudflare-block-ai-bots","manual_kb_tag-gptbot","manual_kb_tag-llms-txt","manual_kb_tag-noai","manual_kb_tag-noimageai","manual_kb_tag-ochrona-tresci-przed-ai","manual_kb_tag-perplexitybot","manual_kb_tag-robots-txt-ai","manual_kb_tag-scraping-tresci","manual_kb_tag-tdmrep","manual_kb_tag-x-robots-tag"],"_links":{"self":[{"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manual_kb\/16190","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manual_kb"}],"about":[{"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/types\/manual_kb"}],"author":[{"embeddable":true,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/users\/6"}],"version-history":[{"count":1,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manual_kb\/16190\/revisions"}],"predecessor-version":[{"id":16191,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manual_kb\/16190\/revisions\/16191"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/media\/10957"}],"wp:attachment":[{"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/media?parent=16190"}],"wp:term":[{"taxonomy":"manualknowledgebasecat","embeddable":true,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manualknowledgebasecat?post=16190"},{"taxonomy":"manual_kb_tag","embeddable":true,"href":"https:\/\/dhosting.pl\/pomoc\/wp-json\/wp\/v2\/manual_kb_tag?post=16190"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}