Total Pageviews

Blog Archive

Procura neste Blog

ITO-NeTthings. Com tecnologia do Blogger.

É verdade que somos capazes de ver apenas 3% da Internet? O resto é deep web?

É verdade que somos capazes de ver apenas 3% da Internet? O resto é deep web?
Share it:
Aquilo que existe à superfície equivale, segundo especialistas, a cerca de 4% do todo que a “web” tem para oferecer. Ou seja não 3% mas sim 4%. A diferença não é muita.

É verdade que somos capazes de ver apenas 3% da Internet? O resto é deep web?

O Mundo da Internet é infinito e a quantidade de informação que podemos adquirir é inimaginável. Os motores de pesquisa como por exemplo o Google, ajudam os utilizadores a encontrar facilmente e de uma forma rápida o que procuram. Mas essa informação, presente em sites que visitamos diariamente, representam apenas cerca de 20% da Internet. Mas onde estão os restantes 80%??? …a Deep Web é a resposta.

Quando se diz que na internet é possível aprender como construir bombas, comprar drogas e documentos falsificados, entre outras coisas, geralmente é sobre a deep web que estão a falar, assim como é lá também que surgem organizações como Wikileaks e Anonymous, e são essas pessoas que discutem a web como um organismo livre e democrático.

Mas para saberes tudo mais em pormenor lê o seguinte artigo: https://bit.ly/3g6Pu66

Para responder à pergunta do titulo vamos ver alguns termos:

The Web: As partes dos sites pesquisadas e indexadas pelos fornecedores de mecanismos de pesquisa, por exemplo, perguntas e respostas no Google, artigos da Wikipedia, artigos de notícias, vídeos do YouTube etc.

The Deep Web: As partes dos sites que são acessíveis ao público (embora às vezes apenas através do login do utilizador), mas não são indexadas, por exemplo, comentários, documentos de pesquisa pagos, páginas individuais de contas de utilizadores para bancos ou jogos, conteúdo pago em serviços de streaming etc.

The Dark Web: sites ou serviços que não se consegue aceder através da Web pública, que precisam de um programa especial para aceder (TOR) ou que não usam endereços ou URLs acessíveis ao público, por exemplo, sites .onion, acesso VPN a terminais remotos ou sites internos, qualquer número de aplicações especializados que usam protocolos proprietários, como partilha de arquivos ponto a ponto ou programas de bate-papo.

Devido à crescente popularidade de programas como os navegadores TOR, algumas pessoas consideram coisas como sites .onion como parte da deep web, não da dark web. Portanto, esse pode ser um alvo em movimento, na verdade existem alguns mecanismos de pesquisa na rede TOR que tentam indexar esses sites. Portanto, alguns deles podem até ser considerados parte da Web antiga e comum por alguns.

É bastante difícil estimar o número total de páginas versus o número de páginas indexadas, mas a maioria das estimativas coloca entre 1% e 7%. A grande maioria do conteúdo não indexado é de fóruns / comentários e informações bloqueadas atrás de logins. Muitas dessas páginas nem sequer podem ser efectivamente categorizadas.

Como contar quantas páginas são apenas para o utilizador por trás do login no banco? Como classificar informações dinâmicas não indexadas, como threads de mensagens (para as quais o mesmo conteúdo pode ser incorporado numa dúzia de páginas mais sensíveis ao contexto)? As suposições que se fizer sobre esses factores mudarão drasticamente esse número. Portanto, é preciso examinar a metodologia de qualquer pessoa que faça uma reivindicação a um número específico.

Mas, independentemente das suposições, é bastante claro que a grande maioria das informações disponíveis não é indexada e é inacessível para quem não sabe onde procurar.

Portanto, segundo especialistas apenas 4% está visível mas se fosse 0,01% ou 3% ou até 10%, depende inteiramente de como se deseja contar objectos nos vários níveis da web.

Basicamente é impossível saber o número ao certo. Pode ocorrer uma estimativa para fins estatísticos ou para "quantizar" o numero de dados que realmente andam por aí.

Espero que tenhas gostado.
Share it:

info

Post A Comment:

0 comments: