La web és un oceà d’informació.

Quan hi naveguem, però, només anem per la superfície i la resta queda, en gran part, amagada als nostres ulls: l’anomenada Internet Profunda conté uns quants ordres de magnitud de dades més que la web navegable.

Darrere d’aquest nom tan sonor, però, no s’hi amaga exactament un gran misteri, o només una zona fosca… hi ha fins i tot informació que no es podria ni considerar amagada: senzillament no està indexada pels cercadors (que això moltes vegades sigui equivalent a que no surt als resultats de cerca i per tant el comú dels mortals no ho trobem, és una altra cosa), o està darrere de protocols que no usen els navegadors:

  • Informació darrere de protocols no usats per navegació normal i no indexats pels grans cercadors (fp, per exemple)
  • Pàgines accessibles només amb usuari i password
  • Pàgines generades dinàmicament a partir de consultes a bases de dades, i amb contingut que pot variar
  • Pàgines tancades als robots de cerca, però no a una navegació directa (cal saber l’adreça)
  • Pàgines sense cap tipus de lligam exterior.
  • Informació en formats que fins ara no son indexables (imatges, vídeos).

I perquè no es deixa accedir aquesta informació directament? (que és diferent d’amagar). Pot ser, per exemple, per

  • privacitat (planes amb dades dels clients, perfils - imagineu que el vostre correu web fos accessible així, sense més),
  • motius econòmics (subscripcions de pagament a revistes, grups de treball, fòrums),
  • planes en preparació o bé amb informació antiga o, senzillament, per construcció tècnica (pàgines resultats de consultes a bases de dades, o que es reconfiguren en funció de qui hi accedeix…)
  • i segurament alguns més…

L’analogia de la web profunda vé donada perquè tota aquesta informació podria ser accessible via navegadors, com una extensió de la informació públicament accessible, i en canvi queda fora del nostra abast immediat, com l’aigua que hi ha sota la superfície de l’oceà però que no veiem…

La pregunta és si s’ha de considerar part de la pròpia web o no: una xarxa que ha deixat de ser només un canal d’informació per ser també un canal de serveis, negoci, treball, economia, política… o sigui: una extensió més de la societat, ha de tenir la mateixa concepció d’obertura i accés que abans?

Anomenar-la web profunda (tot i la ressonància èpica i aventurera de l’expressió) sembla destapar també una mena de conflicte latent entre aquell qui vol mantenir amagada aquella informació (quelcom a ocultar?) i el deure/necessitat de ser mostrada, la obertura i la transparència que sembla comportar la xarxa. I no és sempre així: Google mateix, un dels interessats a poder indexar tota aquesta web profunda, no manté una part d’ella amb els llibres que ha escanejat i no son oberts?

Cal diferenciar entre el que és a) el fet d’amagar directament informació i b) considerar part de la mateixa xarxa un volum de dades que el que fa és donar suport a allò publicat o ser accessible per la xarxa com una via més: la intencionalitat en ambdós casos i la lectura que se’n pot fer son molt diferents i per tant la necessitat de poder accedir-hi, també.

Vist així, sempre acabarà existint una part de web profunda, perquè sempre caldrà suport als sistemes d’informació, o pàgines sense enllaços, o protocols no directament accessibles per navegador.


Comments:

La xarxa profunda (II): la part fosca. | Quasi un bloc - Nov 2, 2013

[…] xarxa profunda és bàsicament un gran conjunt d’informació fora de l’abast dels accessos convencionals: un volum d’informació unes quantes vegades major que al que podem arribar via cercadors o […]