feat: Bloqueio agressivo de IA Crawlers, RECON scanners e SEO Scrapers

This commit is contained in:
João Pedro Toledo Goncalves 2026-02-04 19:58:01 -03:00
parent da539fa86d
commit 0634f09113
1 changed files with 13 additions and 6 deletions

View File

@ -4,14 +4,21 @@
# Bad Bot Detection
map $http_user_agent $is_bad_bot {
default 0;
# Scanners e Ferramentas de Exploração
# Scanners, Exploração e Reconhecimento de Rede (RECON)
~*(nikto|sqlmap|wpscan|gobuster|dirbuster|feroxbuster|nessus|nmap|curl|wget|python|php|perl|ruby|java) 1;
# Crawlers Agressivos e Scrapers
~*(Acunetix|Netsparker|AppScan|Zgrab|Masscan|OpenVAS|Scanbot|ZmEu|Morfeus|Jorgee|Havij|Nuclei|Tsunami) 1;
~*(Shodan|Censys|ZoomEye|BinaryEdge|Smap|N-Stealth|N-Sentinel|ScanAlert) 1;
# Crawlers Agressivos e Scrapers de Conteúdo
~*(HTTrack|ia_archiver|mj12bot|AhrefsBot|DotBot|SemrushBot|MJ12bot|DataForSeoBot|PetalBot|QuerySeekerSpider) 1;
# Bots de IA e Outros (Não desejados por padrão)
~*(GPTBot|ChatGPT-User|CCBot|PerplexityBot|Omgilibot|Bytespider|YisouSpider) 1;
# Ferramentas de Automação e Vulnerabilidade
~*(Acunetix|Netsparker|AppScan|Zgrab|Masscan|OpenVAS|Scanbot|ZmEu|Morfeus|Jorgee) 1;
~*(SEO-Crawler|SEOstats|SpyFu|Lighthouse|PageSpeed|SiteAudit) 1;
# Bloqueio Total de IA Crawlers (Treinamento e Coleta)
~*(GPTBot|ChatGPT-User|OAI-SearchBot|anthropic-ai|ClaudeBot|Claude-Web|Claude-User|Claude-SearchBot) 1;
~*(Google-Extended|Google-CloudVertexBot|Bard-Ai|Gemini-Ai|GoogleAgent-Mariner) 1;
~*(FacebookBot|Meta-ExternalAgent|meta-webindexer|Applebot-Extended|Amazonbot|Applebot) 1;
~*(PerplexityBot|Perplexity-User|Bytespider|CCBot|Diffbot|Cohere-Ai|DeepseekBot|Youbot) 1;
~*(Omgilibot|Omgili|webzio-extended|HuggingFace-Bot|Brightbot|FirecrawlAgent|Seekr|Sentibot) 1;
}
# Suspicious URI Detection