Muitos profissionais de SEO estão enfrentando uma grande questão: bloquear ou não o ChatGPT?
Vários sites populares já bloquearam o GPTBot, presumivelmente porque não desejam que a OpenAI colete seus dados para treinar seus modelos – pelo menos não sem compensação. Além disso, o ChatGPT não cita nem vincula suas fontes.
De acordo com análises, os 15 sites mais populares que bloquearam o ChatGPT são: Amazon.com, Quora.com, NYTimes.com, Shutterstock.com, WikiHow.com, CNN.com, Foursquare.com, Healthline.com, Scribd.com, BusinessInsider.com, Reuters.com, MedicalNewsToday.com, GoodHousekeeping.co, Amazon.co.uk e Tumblr.com.
No entanto, é interessante notar que, embora muitos sites estejam bloqueando o GPTBot, eles não estão bloqueando o CCbot, rastreador da Common Crawl.
Parte dos dados de treinamento usados pela OpenAI, Google e outros vem da Common Crawl.
Existem algumas exceções notáveis que bloqueiam ambos os bots, como o New York Times, que claramente não quer que seu conteúdo seja usado para treinar sistemas de IA.
Outros sites populares que bloqueiam tanto o GPTBot quanto o CCbot incluem Shutterstock.com, Reuters.com e GoodHousekeeping.com.
No mínimo, 62 dos 1.000 principais sites bloquearam o CCBot. Vale ressaltar que 241 arquivos robots.txt dos 1.000 sites não foram identificados ou inspecionados como parte dessa análise.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!