Numera använder ChatGPT möjligheten att hämta information i realtid på webben för sina konversationer. Och det kanske du vill kontrollera som webbansvarig, som med alla andra botar.
ChatGPT har precis som andra botar en user-agent. Det gör att du i serverloggar och verktyg för webbanalys kan se om du fått denna trafik, följa dess utveckling och vilket innehåll den hämtar.
Hur styr eller stoppar man ChatGPT på sin webbplats?
Om du vill kontrollera hur chatboten använder ditt innehåll är det som vanligt så att du skriver reglerna i webbplatsens robots.txt och i det här fallet berättar för ChatGPT hur du vill att den ska uppföra sig.
Exempelvis, om du helt vill stoppa ChatGPT lägger du in:
User-agent: ChatGPT-User
Disallow: /
Eller om du vill tillåta bara vissa delar av webbplatsen för ChatGPT:
User-agent: ChatGPT-User
Disallow: /
Allow: /nyheter/
Allow: /bloggen/
ChatGPT:s åtkomst till träningsdata
Som bot betraktad, alltså när den hämtar information för sin träningsdata, har den följande user-agent:
User agent token: GPTBot
Full user-agent string: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.0; +https://openai.com/gptbot)
Det går att låta GPT-boten få åtkomst till delar av webbplatsen men inte tillåta andra. Så här:
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/