Zonefile
do .BR

100% da zona mapeada!

O que é?

Em suma, uma lista de todos os domínios registrados diretamente sob o .BR, chamados de Domínios de Primeiro Nível (DPNs) pelo Registro.br, ou de Second-Level Domains (SLDs) pelo resto do planeta.

Eles seguem o formato <NOME>.BR. Por exemplo, GOV.BR, UFRJ.BR e COM.BR são todos DPNs, e estão incluídos na lista. Por outro lado, IBGE.GOV.BR, DCC.UFRJ.BR e SPOTIFY.COM.BR não são DPNs; eles estão um nível abaixo.

Para leitores mais experientes, a zona também inclui alguns registros de DNS para todos os domínios e seus respectivos subdomínios WWW. Provavelmente não possui todas as informações que uma zonefile real teria, mas acredito que deve ser suficiente.

Vale notar que a informação é toda publicamente acessível; ela só não é disponibilizada diretamente pelo Registro.br – e foi essa a motivação por trás desse projeto.

A zona

A zona possui 1349 domínios catalogados. Desses, 1207 (89.47%) são domínios contados nas estatísticas do Registro.br, e 142 (10.53%) são considerados somente subdomínios e não constam nas estatísticas oficiais.

Se você só está interessado nos nomes de domínio em si, você pode baixar o seguinte .TXT, que contém um domínio por linha:

Lista de domínios: br.txt (1349 domínios, ≈15 KB)

Se você está interessado na zona em si, com registros de DNS relevantes (como SOA, NS, A, AAAA e NSEC) tanto para o domínio e seu respectivo subdomínio WWW, você pode baixar o seguinte arquivo:

Zona inteira: br.zone (1349 domínios, ≈910 KB)

De todos os domínios catalogados, alguns vieram sem registros SOA. Não entendo de DNS o suficiente para saber o motivo. Assim, separei a zona em duas: uma com 1089 domínios, todos com SOA; e outra com 260 domínios, sem SOA.

Zona de domínios completos: br.SOA.zone (1089 domínios, ≈816 KB)
Zona de domínios incompletos: br.NO_SOA.zone (260 domínios, ≈93 KB)

Para além disso, você também pode verificar a planilha no Google Sheets que estou usando para catalogar cada domínio.

Atualizado em 30 de agosto de 2023


Table of Contents:

  1. Contexto
  2. Diferenças das estatísticas oficiais
    1. CAN.br
    2. CRI.br
  3. Estatísticas
    1. Parcela por categoria
    2. Quantidade de domínios por primeira letra
    3. Quantidade de domínios por tamanho
    4. Agregado de domínios registrados
  4. Detalhes
  5. Construção da lista

Contexto

Em agosto de 2021, perguntei ao Registro.br se a zona de DNS do .BR era pública. Recebi uma resposta negativa, me informando que o máximo disponível ao público era a página de estatísticas do Registro.br. Então, comecei a compilar a zona eu mesmo. Este é o resultado. Uma lista não oficial e voluntariamente mantida de todos os domínios registrados diretamente sob .BR.

No início dos anos 2000, o Comitê Gestor da Internet (CGI) no Brasil relatou abuso no registro de DPNs no .BR, e tomou a decisão de limitar o registro de novos DPNs, o que até então era liberado.[1] De fato, verificando a lista compilada, múltiplas instituições possuem mais de 20 DPNs.

Assim, desde circa 2005, pouquíssimos novos domínios .BR foram registrados. Portanto, é possível compilar uma lista completa com todos eles – e o objetivo desse projeto era construí-la.

Referências
  1. Nota de Esclarecimento sobre utilização do DPN .edu. Núcleo de Informação e Coordenação do Ponto BR.

Diferenças das estatísticas oficiais

Diferentemente dos 1349 domínios que eu encontrei, a página de estatísticas do Registro.br alega somente 1207 domínios registrados diretamente sob o .BR. Com esse projeto, pude determinar com algum nível de confiança que esse número não inclui os 140 subdomínios disponíveis para registro. Na verdade, 1207 é o exato número de domínios que respondem a queries de whois; o resto – os subdomínios – retorna coisas como "blocked_word: CG" ou "reserved: trademark".

Contudo, 1349(total encontrado) − 1207(total oficial) = 142, dois a mais do que os 140 subdomínios na página de categorias do Registro.br. Isso se dá pois há 2 subdomínios faltantes, não mais disponíveis para registro e escondidos do público. Eles são CAN.BR e CRI.BR:

CAN.BR

Subdomínio para websites oficiais de candidatos eleitorais, seria sempre no formato <NOME>⁠<NÚMERO>.CAN.BR, correspondendo ao que um eleitor veria na urna no dia da votação.

Por exemplo, durante as eleições para prefeito de Aracaju (SE), em 2004, Marcelo Déda teve deda13.can.br, e Jorge Alberto teve jorgealberto15.can.br (ambos os links, aqui, são para versões arquivadas dos websites).

O CAN.BR parece ter sido usado em 5 eleições, começando em 2000; em seu pico, em 2008, mais de 9 mil domínios foram registrados sob ele. Contudo, desde 2009, nenhum novo domínio CAN.BR foi registrado.

Leia mais: Larissa Januário (24 de março de 2008). Eleições 2008: candidatos terão domínio can.br. WNews.

Fonte: Gráfico de domínios CAN.BR desde 1996. Registro.br. Acesso em 29 de agosto de 2023.

CRI.BR

Subdomínio para Cartórios de Registro Imobiliário (ou CRIs). Aparece listado na categoria de domínios para pessoas jurídicas do Registro.br, com a obrigatoriedade de DNSSEC, em meados de setembro de 2015 (página arquivada) e desaparece novamente em meados de julho de 2017 (página arquivada).

Pelo gráfico oficial – que não está em nenhuma página, mas pode ser encontrado diretamente pelo URL – só um único domínio CRI.BR foi registrado na história, em meados de 2016. Pouco mais de um ano depois, ele foi apagado; e, desde então, nenhum outro domínio sob o CRI.BR existiu.

Entrei em contato com o Registro.br em setembro de 2021, mas não recebi nenhuma informação sobre o subdomínio: "Infelizmente, não temos a informação que deseja acerca das DPNs aposentadas".

Fonte: Gráfico de domínios CRI.BR desde 1996. Registro.br. Acesso em 29 de agosto de 2023.

Estatísticas

Aqui estão algumas informações para você, pessoa curiosa:

  • Há apenas um IDN, ou "nome de domínio internacionalizado": ICANNSÃOPAULO.BR, um dos 4 domínios registrados para o evento "ICANN Meeting São Paulo", de dezembro de 2006.
    IDNs possuem caracteres considerados especiais; nesse caso, o Ã. Tecnicamente, o nome real do domínio é XN⁠--⁠ICANNSOPAULO-7BB.BR, em uma representação chamada "Punycode". Dito isso, ele também é o único domínio que começa com a letra X.

Parcelas por categoria


Quantidade de domínios por primeira letra (ou dígito)

Não sei se essa informação é útil para alguém, mas eu fiquei curioso e quis fazer o gráfico. Curiosamente, a única letra que não possui nenhum domínio é a letra Y.

  • Para K, há KENNEDY.BR, das Faculdades Kennedy;
  • Para Q, há QSL.BR, subdomínio para rádio amadores;
  • Para X, há XN⁠--⁠ICANNSOPAULO-7BB.BR, Punycode de ICANNSÃOPAULO.BR.

Quantidade de domínios por tamanho

Tamanho, aqui, indica a quantidade de caracteres antes do ".BR". Por exemplo, "COM.BR" possui tamanho 3.

O domínio mais curto é B.BR, subdomínio para bancos, de tamanho 1. Ele permite o cômico bb.b.br, reservado pelo Banco do Brasil (mas inutilizado).

O domínio mais longo é FACULDADESMACHADODEASSIS.BR, um domínio de 24 letras registrado em julho de 2000 que, infelizmente, não é mais usado.

Agregado de domínios registrados

Quantidade aproximada, baseada em dados de WHOIS; não inclui domínios que foram posteriormente deletados. Alguns domínios, considerados subdomínios, não possuem respostas para WHOIS, impossibilitando a descoberta de sua exata data de registro. Compare com o gráfico oficial.

O domínio mais antigo com data exata de registro é FAPESP.BR (Fundação de Amparo à Pesquisa do Estado de São Paulo), criado em 18 de abril de 1989 – mesma data de registro do .BR como um todo; vide registro de delegação do .BR. Há outros domínios, como UFRJ.BR, cujos WHOIS retornam criação "antes de 1995", mas sem especificar data exata.

Por outro lado, o domínio mais recente é REDNESP.BR (Research and Education Network at São Paulo), registrado em 4 de maio de 2021.

(conferido por último em outubro de 2023)

IPs e Email

Em termos de IP, 840 (62.27%) domínios possuem algum registro de endereço – seja com A, AAAA ou um redirecionamento por CNAME. Isso não significa, necessariamente, que todos possuem websites. Consequentemente, 509 (37.73%) definitivamente não são acessíveis por um navegador.

Em termos de email, 725 (53.74%) domínios possuem registros MX, contra 624 (46.26%) que não têm. Novamente, isso não significa que todos estão suficientemente configurados para receber e enviar emails.

Há 649 (48.11%) domínios que estão presentes em ambas as categorias: possuem tanto IP, quanto email. Além disso, 191 (14.16%) possuem IP mas não email, e 76 (5.63%) possuem email mas não IP.

Por outro lado, 433 (32.1%) não possuem nem um, nem outro; subtraindo 141 subdomínios (142 menos GOV.BR, que possui esses registros), são 292 (21.65%) domínios "reais" sem IP ou email.


Detalhes

Aqui estão os comandos que foram usados para gerar a zona, a partir de uma lista pré-existente de nomes a serem conferidos:

# Primeiro, pedimos o registro SOA ao Google
dig @8.8.8.8 $SLD.br. SOA +noall +answer +authority +additional
# E os registros NS diretamente ao DNS.br
dig @a.dns.br $SLD.br. NS +noall +answer +authority +additional

# Em seguida, perguntamos pela existência de registros A, AAAA e MX,
# tanto para o domínio em si, quanto para seu subdomínio www
dig @8.8.8.8 $SLD.br. A +noall +answer
dig @8.8.8.8 $SLD.br. AAAA +noall +answer
dig @8.8.8.8 $SLD.br. MX +noall +answer
dig @8.8.8.8 www.$SLD.br. A +noall +answer
dig @8.8.8.8 www.$SLD.br. AAAA +noall +answer
dig @8.8.8.8 www.$SLD.br. MX +noall +answer

# Por fim, NSEC; vide explicação abaixo
dig @a.dns.br "$SLD#.br." NSEC +noall +answer +authority +additional +dnssec

Requisitamos, via NSEC no final, o nome do próximo domínio – uma espécie de zone walking, mas meramente a título de curiosidade, pois já temos a lista de nomes; um "zone looking", se preferir. Realisticamente, "⁠<SLD>#.BR" (sim, com #) não é um domínio real nem nunca será; e não há como existir domínio alfabeticamente entre "<SLD>.BR" e "<SLD>#.BR". Então, pedir NSEC de "<SLD>#.BR" nos retorna como resposta um status de NXDOMAIN, com o próximo domínio válido. Em tese, este será o domínio testado imediatamente a seguir.

Aqui está uma entrada da lista, extraída para melhor ilustrar como ela é depois de gerada:

;; itpac.br.
itpac.br.		1800	IN	SOA	fiona.ns.cloudflare.com. dns.cloudflare.com. [...]
itpac.br.		3600	IN	NS	fiona.ns.cloudflare.com.
itpac.br.		3600	IN	NS	pete.ns.cloudflare.com.
itpac.br.		300	IN	A	104.18.14.38
itpac.br.		300	IN	A	104.18.15.38
itpac.br.		300	IN	AAAA	2606:4700::6812:f26
itpac.br.		300	IN	AAAA	2606:4700::6812:e26
itpac.br.		3600	IN	MX	0 itpac-br.mail.protection.outlook.com.
www.itpac.br.		300	IN	A	104.18.14.38
www.itpac.br.		300	IN	A	104.18.15.38
www.itpac.br.		300	IN	AAAA	2606:4700::6812:e26
www.itpac.br.		300	IN	AAAA	2606:4700::6812:f26
itpac.br.		900	IN	NSEC	iuperj.br. NS DS RRSIG NSEC
itpac.br.		900	IN	RRSIG	NSEC 13 2 900 20230907120516 [...]

Toda entrada na lista começa com um cabeçalho informando a qual domínio ela se refere.

Em seguida, há uma linha com o registro SOA. Nem todos os domínios possuem um – algo que, no meu entendimento, nem deveria ser possível. Ainda que estranhos, estes possuem nameservers, registros NSEC e até presença no whois. Então, eles definitivamente existem; são diferentes de domínios cuja resposta é NXDOMAIN. Estão em alguma outra forma de limbo.

Na sequência, há informações sobre os registros encontrados: A e AAAA (ou CNAME, se for o caso), e MX. Eles são testados para o domínio em si, e para o subdomínio "WWW.<SLD>.BR".

A entrada termina com o registro NSEC, indicando a entrada logo a seguir.


Construção da lista

Esta lista teve como ponto de partida a lista de domínios mais geral disponibilizada por jtwaleson (domainnames.gz), e a lista "Majestic Million", da empresa Majestic. Alguns domínios curtos foram encontrados por força bruta; através desse método, todas as combinações de 3 letras e/ou dígitos, [A⁠-⁠Z0⁠-⁠9]⁠{1,3}\.br, e também de 4 letras (sem dígitos), [A⁠-⁠Z]{4}\.br, foram conferidas. Essas iniciativas foram suficientes para agregar 803 domínios, aproximadamente 60% do total.

A zona final só pôde ser compilada através do trabalho altruísta de Zach Bloomquist, que publicou no repositório zone-walks a "caminhada" de DNS do .BR, usando uma peculiaridade de registros NSEC. Os 40% finais da lista são inteiramente devido ao trabalho dele, e eu serei eternamente grato.