Прописать в robots.txt
User-agent: GPTBot
Disallow: /
Но кроме этого существует еще СommonСrawl.org, бесплатный открытый репозиторий данных веб-сканирования, который может использовать каждый. Разные чат-боты на основе нейросетей, также берут данные и оттуда. Чтобы защитить данные своего сайта от попадания в CommonCrawl необходимо прописать в robots.txt ещё и это:
User-agent: CCBot
Disallow: /
★ Встречайте новый бренд под tier-1 от StarCrown Partners – Spinfest! Тесты на DACH гео показали х2 конверт р2д! Регистрация по ссылке
★ Подписывайтесь на R2B.News
Наши новости в Телеграм.
★ Подписывайтесь на R2B.Work
Телеграм канал с беспрерывным потоком вакансий для работы по найму в iGaming индустрии: Удаленно / Релокация / Офис.
★ Подписывайтесь на R2B.Aff
Беспрерывный поток свежих офферов от различных iGaming партнерских программ.
По теме: