O que é?
Em suma, uma lista de todos os domínios registrados diretamente sob o .BR, chamados de Domínios de Primeiro Nível (DPNs) pelo Registro.br, ou de Second-Level Domains (SLDs) pelo resto do planeta.
Eles seguem o formato <NOME>.BR. Por exemplo, GOV.BR, UFRJ.BR e COM.BR são todos DPNs, e estão incluídos na lista. Por outro lado, IBGE.GOV.BR, DCC.UFRJ.BR e SPOTIFY.COM.BR não são DPNs; eles estão um nível abaixo.
Para leitores mais experientes, a zona também inclui alguns registros de DNS para todos os domínios e seus respectivos subdomínios WWW. Provavelmente não possui todas as informações que uma zonefile real teria, mas acredito que deve ser suficiente.
Vale notar que a informação é toda publicamente acessível; ela só não é disponibilizada diretamente pelo Registro.br – e foi essa a motivação por trás desse projeto.
A zona
A zona possui 1349 domínios catalogados. Desses, 1207 (89.47%) são domínios contados nas estatísticas do Registro.br, e 142 (10.53%) são considerados somente subdomínios e não constam nas estatísticas oficiais.
Se você só está interessado nos nomes de domínio em si, você pode baixar o seguinte .TXT, que contém um domínio por linha:
Se você está interessado na zona em si, com registros de DNS relevantes (como SOA, NS, A, AAAA e NSEC) tanto para o domínio e seu respectivo subdomínio WWW, você pode baixar o seguinte arquivo:
De todos os domínios catalogados, alguns vieram sem registros SOA. Não entendo de DNS o suficiente para saber o motivo. Assim, separei a zona em duas: uma com 1089 domínios, todos com SOA; e outra com 260 domínios, sem SOA.
Para além disso, você também pode verificar a planilha no Google Sheets que estou usando para catalogar cada domínio.
Table of Contents:
Contexto
Em agosto de 2021, perguntei ao Registro.br se a zona de DNS do .BR era pública. Recebi uma resposta negativa, me informando que o máximo disponível ao público era a página de estatísticas do Registro.br. Então, comecei a compilar a zona eu mesmo. Este é o resultado. Uma lista não oficial e voluntariamente mantida de todos os domínios registrados diretamente sob .BR.
No início dos anos 2000, o Comitê Gestor da Internet (CGI) no Brasil relatou abuso no registro de DPNs no .BR, e tomou a decisão de limitar o registro de novos DPNs, o que até então era liberado.[1] De fato, verificando a lista compilada, múltiplas instituições possuem mais de 20 DPNs.
Assim, desde circa 2005, pouquíssimos novos domínios .BR foram registrados. Portanto, é possível compilar uma lista completa com todos eles – e o objetivo desse projeto era construí-la.
Referências- Nota de Esclarecimento sobre utilização do DPN .edu. Núcleo de Informação e Coordenação do Ponto BR.
Diferenças das estatísticas oficiais
Diferentemente dos 1349 domínios que eu encontrei, a página de estatísticas do Registro.br alega somente 1207 domínios registrados diretamente sob o .BR. Com esse projeto, pude determinar com algum nível de confiança que esse número não inclui os 140 subdomínios disponíveis para registro. Na verdade, 1207 é o exato número de domínios que respondem a queries de whois; o resto – os subdomínios – retorna coisas como "blocked_word: CG" ou "reserved: trademark".
Contudo, 1349(total encontrado) − 1207(total oficial) = 142, dois a mais do que os 140 subdomínios na página de categorias do Registro.br. Isso se dá pois há 2 subdomínios faltantes, não mais disponíveis para registro e escondidos do público. Eles são CAN.BR e CRI.BR:
CAN.BR
Subdomínio para websites oficiais de candidatos eleitorais, seria sempre no formato <NOME><NÚMERO>.CAN.BR, correspondendo ao que um eleitor veria na urna no dia da votação.
Por exemplo, durante as eleições para prefeito de Aracaju (SE), em 2004, Marcelo Déda teve deda13.can.br, e Jorge Alberto teve jorgealberto15.can.br (ambos os links, aqui, são para versões arquivadas dos websites).
O CAN.BR parece ter sido usado em 5 eleições, começando em 2000; em seu pico, em 2008, mais de 9 mil domínios foram registrados sob ele. Contudo, desde 2009, nenhum novo domínio CAN.BR foi registrado.
Leia mais: Larissa Januário (24 de março de 2008). Eleições 2008: candidatos terão domínio can.br. WNews.
CRI.BR
Subdomínio para Cartórios de Registro Imobiliário (ou CRIs). Aparece listado na categoria de domínios para pessoas jurídicas do Registro.br, com a obrigatoriedade de DNSSEC, em meados de setembro de 2015 (página arquivada) e desaparece novamente em meados de julho de 2017 (página arquivada).
Pelo gráfico oficial – que não está em nenhuma página, mas pode ser encontrado diretamente pelo URL – só um único domínio CRI.BR foi registrado na história, em meados de 2016. Pouco mais de um ano depois, ele foi apagado; e, desde então, nenhum outro domínio sob o CRI.BR existiu.
Entrei em contato com o Registro.br em setembro de 2021, mas não recebi nenhuma informação sobre o subdomínio: "Infelizmente, não temos a informação que deseja acerca das DPNs aposentadas".
Estatísticas
Aqui estão algumas informações para você, pessoa curiosa:
-
Há apenas um IDN, ou "nome de domínio internacionalizado": ICANNSÃOPAULO.BR, um dos 4 domínios registrados para o evento "ICANN Meeting São Paulo", de dezembro de 2006.
IDNs possuem caracteres considerados especiais; nesse caso, o Ã. Tecnicamente, o nome real do domínio é XN--ICANNSOPAULO-7BB.BR, em uma representação chamada "Punycode". Dito isso, ele também é o único domínio que começa com a letra X.
Parcelas por categoria
Quantidade de domínios por primeira letra (ou dígito)
Não sei se essa informação é útil para alguém, mas eu fiquei curioso e quis fazer o gráfico. Curiosamente, a única letra que não possui nenhum domínio é a letra Y.
- Para K, há KENNEDY.BR, das Faculdades Kennedy;
- Para Q, há QSL.BR, subdomínio para rádio amadores;
- Para X, há XN--ICANNSOPAULO-7BB.BR, Punycode de ICANNSÃOPAULO.BR.
Quantidade de domínios por tamanho
Tamanho, aqui, indica a quantidade de caracteres antes do ".BR". Por exemplo, "COM.BR" possui tamanho 3.
O domínio mais curto é B.BR, subdomínio para bancos, de tamanho 1. Ele permite o cômico bb.b.br, reservado pelo Banco do Brasil (mas inutilizado).
O domínio mais longo é FACULDADESMACHADODEASSIS.BR, um domínio de 24 letras registrado em julho de 2000 que, infelizmente, não é mais usado.
Agregado de domínios registrados
Quantidade aproximada, baseada em dados de WHOIS; não inclui domínios que foram posteriormente deletados. Alguns domínios, considerados subdomínios, não possuem respostas para WHOIS, impossibilitando a descoberta de sua exata data de registro. Compare com o gráfico oficial.
O domínio mais antigo com data exata de registro é FAPESP.BR (Fundação de Amparo à Pesquisa do Estado de São Paulo), criado em 18 de abril de 1989 – mesma data de registro do .BR como um todo; vide registro de delegação do .BR. Há outros domínios, como UFRJ.BR, cujos WHOIS retornam criação "antes de 1995", mas sem especificar data exata.
Por outro lado, o domínio mais recente é REDNESP.BR (Research and Education Network at São Paulo), registrado em 4 de maio de 2021.
IPs e Email
Em termos de IP, 840 (62.27%) domínios possuem algum registro de endereço – seja com A, AAAA ou um redirecionamento por CNAME. Isso não significa, necessariamente, que todos possuem websites. Consequentemente, 509 (37.73%) definitivamente não são acessíveis por um navegador.
Em termos de email, 725 (53.74%) domínios possuem registros MX, contra 624 (46.26%) que não têm. Novamente, isso não significa que todos estão suficientemente configurados para receber e enviar emails.
Há 649 (48.11%) domínios que estão presentes em ambas as categorias: possuem tanto IP, quanto email. Além disso, 191 (14.16%) possuem IP mas não email, e 76 (5.63%) possuem email mas não IP.
Por outro lado, 433 (32.1%) não possuem nem um, nem outro; subtraindo 141 subdomínios (142 menos GOV.BR, que possui esses registros), são 292 (21.65%) domínios "reais" sem IP ou email.
Detalhes
Aqui estão os comandos que foram usados para gerar a zona, a partir de uma lista pré-existente de nomes a serem conferidos:
# Primeiro, pedimos o registro SOA ao Google dig @8.8.8.8 $SLD.br. SOA +noall +answer +authority +additional # E os registros NS diretamente ao DNS.br dig @a.dns.br $SLD.br. NS +noall +answer +authority +additional # Em seguida, perguntamos pela existência de registros A, AAAA e MX, # tanto para o domínio em si, quanto para seu subdomínio www dig @8.8.8.8 $SLD.br. A +noall +answer dig @8.8.8.8 $SLD.br. AAAA +noall +answer dig @8.8.8.8 $SLD.br. MX +noall +answer dig @8.8.8.8 www.$SLD.br. A +noall +answer dig @8.8.8.8 www.$SLD.br. AAAA +noall +answer dig @8.8.8.8 www.$SLD.br. MX +noall +answer # Por fim, NSEC; vide explicação abaixo dig @a.dns.br "$SLD#.br." NSEC +noall +answer +authority +additional +dnssec
Requisitamos, via NSEC no final, o nome do próximo domínio – uma espécie de zone walking, mas meramente a título de curiosidade, pois já temos a lista de nomes; um "zone looking", se preferir. Realisticamente, "<SLD>#.BR" (sim, com #) não é um domínio real nem nunca será; e não há como existir domínio alfabeticamente entre "<SLD>.BR" e "<SLD>#.BR". Então, pedir NSEC de "<SLD>#.BR" nos retorna como resposta um status de NXDOMAIN, com o próximo domínio válido. Em tese, este será o domínio testado imediatamente a seguir.
Aqui está uma entrada da lista, extraída para melhor ilustrar como ela é depois de gerada:
;; itpac.br. itpac.br. 1800 IN SOA fiona.ns.cloudflare.com. dns.cloudflare.com. [...] itpac.br. 3600 IN NS fiona.ns.cloudflare.com. itpac.br. 3600 IN NS pete.ns.cloudflare.com. itpac.br. 300 IN A 104.18.14.38 itpac.br. 300 IN A 104.18.15.38 itpac.br. 300 IN AAAA 2606:4700::6812:f26 itpac.br. 300 IN AAAA 2606:4700::6812:e26 itpac.br. 3600 IN MX 0 itpac-br.mail.protection.outlook.com. www.itpac.br. 300 IN A 104.18.14.38 www.itpac.br. 300 IN A 104.18.15.38 www.itpac.br. 300 IN AAAA 2606:4700::6812:e26 www.itpac.br. 300 IN AAAA 2606:4700::6812:f26 itpac.br. 900 IN NSEC iuperj.br. NS DS RRSIG NSEC itpac.br. 900 IN RRSIG NSEC 13 2 900 20230907120516 [...]
Toda entrada na lista começa com um cabeçalho informando a qual domínio ela se refere.
Em seguida, há uma linha com o registro SOA. Nem todos os domínios possuem um – algo que, no meu entendimento, nem deveria ser possível. Ainda que estranhos, estes possuem nameservers, registros NSEC e até presença no whois. Então, eles definitivamente existem; são diferentes de domínios cuja resposta é NXDOMAIN. Estão em alguma outra forma de limbo.
Na sequência, há informações sobre os registros encontrados: A e AAAA (ou CNAME, se for o caso), e MX. Eles são testados para o domínio em si, e para o subdomínio "WWW.<SLD>.BR".
A entrada termina com o registro NSEC, indicando a entrada logo a seguir.
Construção da lista
Esta lista teve como ponto de partida a lista de domínios mais geral disponibilizada por jtwaleson (domainnames.gz), e a lista "Majestic Million", da empresa Majestic. Alguns domínios curtos foram encontrados por força bruta; através desse método, todas as combinações de 3 letras e/ou dígitos, [A-Z0-9]{1,3}\.br, e também de 4 letras (sem dígitos), [A-Z]{4}\.br, foram conferidas. Essas iniciativas foram suficientes para agregar 803 domínios, aproximadamente 60% do total.
A zona final só pôde ser compilada através do trabalho altruísta de Zach Bloomquist, que publicou no repositório zone-walks a "caminhada" de DNS do .BR, usando uma peculiaridade de registros NSEC. Os 40% finais da lista são inteiramente devido ao trabalho dele, e eu serei eternamente grato.