Conoce Atico34 - Solicita presupuesto
Nuevas tecnologias

Almacenamiento de datos y Dispositivos Data storage

El desarrollo de las nuevas tecnologías y, en concreto, de las TIC (tecnologías de la información y la comunicación) y la informática, han hecho que el almacenamiento de datos haya evolucionado notablemente en los últimos años, desde el desarrollo de nuevos soportes, hasta el aumento de la capacidad de almacenamiento. Muchos hemos sido testigos del paso de la cinta magnética al CD y el DVD, la llegada del pendrive, los discos duros externos y, finalmente, el almacenamiento en la nube.

En este artículo veremos qué es el almacenamiento de datos, su historia, sus principales tipos y dispositivos y qué desafío supone el almacenamiento de datos masivos en la actualidad.

¿Qué es el almacenamiento de datos? Definición

El almacenamiento de datos es el proceso a través del cual se graba la información que manejamos o manejan los sistemas en el día a día. Esta información se puede grabar en soportes ópticos o electromagnéticos, para después seguir siendo accesible. Es decir, los datos son almacenados en dispositivos de almacenamiento o data storage.

En otras palabras, el almacenamiento de datos es el proceso mediante el cual se archivan, organizan y distribuyen los bytes que forman los datos y que están presentes en muchos aspectos de nuestra vida cotidiana en la actualidad; desde los protocolos de red, pasando por los documentos de texto, el contenido multimedia o las aplicaciones que usamos en nuestros móviles.

El almacenamiento y procesamiento de datos se han convertido en dos de los pilares fundamentales del Big Data. Sin embargo, almacenar datos sin ningún tipo de orden, estrategia u organización haría que los sistemas que dependen de ellos fueran poco eficientes y útiles, más allá de guardar los datos. Por ello, la función del almacenamiento de datos en una empresa consiste también en crear un conjunto de especificaciones con el objetivo de definir cómo, cuándo y qué información se almacena y cómo se accede a ella.

Historia del almacenamiento de datos

Aunque cuando pensamos en administración y almacenamiento de datos, enseguida pensamos en sistemas informáticos, lo cierto es que la historia del almacenamiento de datos se remonta bastante en el tiempo, ya que el ser humano ha necesitado almacenar cada vez más información para después poder acceder a ella y manejarla.

Si bien nos podemos remontar al siglo XIX y los pioneros de la informática con las invenciones de Charles Babagge y Ada Lovelace, lo cierto es que el primer dispositivo de almacenamiento de datos como tal surgió en 1947 con el Williams-Kilburn Tube; se tratada de una suerte de pantalla en la que aparecían y desparecían píxeles emulando bits de información. Este tubo fue uno de los primero dispositivos RAM del mercado y fue empleado por los ordenadores de IBM de 1952. Esta memoria de tubo tenía una capacidad de 0,0625 KB.

Poco después, en la década de los 50 llegaría la primera memoria magnética, el Tambor Magnético, con una capacidad de 10 KB, es el precursor del moderno plato del disco duro actual. Pero sería IBM la primera compañía en desarrollar el antecesor del disco duro moderno; el IBM 305 RAMAC fue el primer disco duro magnético, capaz de almacenar 5 MB de datos, era una «máquina» enorme (pesaba varias toneladas y ocupaba una habitación entera).

Después, y también de la mano de IBM, llegó el primer disquete en 1971, con una capacidad de 79,7 KB y 8 pulgadas (20,32 centímetros) de tamaño. Llegamos a los años 80 y los primeros discos duros tal y como los conocemos ahora, si bien más grandes y con menor capacidad, puesto que comenzaron midiendo en megabytes. Si bien, no hay que olvidar que durante esos años las cintas magnéticas (los casetes) también se usaban como unidades de almacenamiento; la primera llegó en 1962, con 660 KB de capacidad por cada lado. Aunque su uso siempre ha estado más asociado con el audio y el vídeo, también se emplearon en informática.

Mientras los discos duros y los disquetes seguían su evolución reduciendo tamaño físico y aumentado su capacidad de almacenamiento, en la década de los 90 los soportes externos y portátiles vieron llegar el CD primero, con 700 MB, la más desconocida Unidades Zip y finalmente el DVD, que alcanzaba ya los 4.7 GB de capacidad (y que hoy en día sigue más o menos en uso).

Llegamos al año 2000 y aparecen las memorias flash (empleadas por los pendrives) y las tarjetas SD, que si bien empezaron con una capacidad de almacenamiento mínima de 8 MB y 32 MB respectivamente, en la actualidad son capaces de almacenar cientos de GB. También se estrena el Blu-ray, que alcanza los 25 GB.

Llegamos a la tercera década del siglo XXI, en la que todavía usamos discos duros magnéticos (HDD) como unidades de almacenamiento de datos digitales, pero mucho más pequeños y con capacidades de hasta 16 o 32 TB (terabytes). Y la proliferación de los SDD o discos de estado sólido, mucho más pequeños aún y con una velocidad de escritura y lectura mayor que la de los HDD, puesto que se usan una memoria tipo flash para almacenar datos. Su capacidad aún no iguala a la de los HDD, pero ya se pueden encontrar con 1 o 2 TB.

Finalmente, la última evolución en los sistemas de almacenamiento de datos la tenemos en el almacenamiento en la nube; donde se «prescinde» del almacenamiento físico para archivar y acceder a la información guardada en ella. Este tipo de almacenamiento permite acceder a los datos almacenados desde cualquier dispositivo, lugar y momento y hablaremos más en profundidad de él un poco más adelante.

Almacenamiento de datos digitales

¿Qué tipos de almacenamiento de datos existen?

El almacenamiento de datos en informática se divide en varios tipos, que vamos a ver a continuación.

Almacenamiento definido por software

El almacenamiento definido por software o SDS se basa en una arquitectura de almacenamiento de datos que separa el software del hardware, es decir, que no depende del hardware propietario, lo que lo hace muy flexible y facilita la expansión de su capacidad.

El SDS funciona extrayendo los elementos que controlan las solicitudes de almacenamiento, para poder determinar cómo y dónde se guardan los datos, es decir, separa los datos del hardware, les cambia el formato y los organiza para su uso en red. Gracias a esa independencia del hardware, puede conectar diferentes plataformas de objetos, HDD externos, SDD o servidores virtuales para crear una infraestructura de almacenamiento unificada.

Además, el SDS es adaptable y, en teoría, infinitamente escalable.

Almacenamiento en la nube

El almacenamiento de datos en la nube se basa en el archivar, organizar y distribuir los datos en distintos volúmenes de almacenamiento virtualizado, a los que se puede acceder desde cualquier lugar, dispositivo y momento, siempre que se cuente con los permisos de acceso correspondientes y se tenga conexión a Internet.

Básicamente, la virtualización consiste en extraer espacio de almacenamiento de diferentes conjuntos de servidores. Mediante el uso de software de automatización de gestión, se crea un almacenamiento en la nube al que se puede acceder desde cualquier dispositivo conectado a la Red.

Al almacenar los datos en la nube, se prescinde de las unidades físicas o las redes internas, puesto que todo queda subido y almacenado en la propia nube, que se divide en tres tipos: nube pública, nube privada y nube híbrida.

Al igual que el SDS, con el que comparte muchas características, el almacenamiento en la nube es muy flexible y escalable, además, al prescindir de infraestructura física o hardwares, su implementación es muy rápida y la capacidad de almacenamiento se puede ir ampliando o reduciendo en función de las necesidades de la base de datos.

Son ejemplos de almacenamiento de datos en la nube Dropbox, Google Drive, Amazon Web Servicies o Microsfot Azure.

Almacenamiento adjunto a la red

El almacenamiento adjunto a la red o NAS es una de las arquitecturas de almacenamiento de archivos más usadas e importantes. Se base en facilitar el acceso a los datos almacenados desde los dispositivos conectados a una misma red.

El sistema NAS se basa en un hardware de almacenamiento preconfigurado, que incluye un sistema operativo ligero para operar en él. A este hardware se lo conoce normalmente como caja NAS o servidor NAS y contiene discos o unidades de almacenamiento, procesadores y una RAM.

Las cajas NAS solo procesan dos tipos de solicitudes, almacenar datos y el uso compartido de archivos. Para acceder a los datos, los usuarios utilizan un servidor central que conecta todo el sistema y direcciona las solicitudes, es decir, desde cualquier ordenador conectado al NAS, se puede acceder a los datos que almacena a través de los protocolos de transferencia.

El NAS funciona básicamente a través de dos protocoles fundamentales: el protocolo de Internet (IP) y el protocolo de transmisión (TCP). El segundo combina los datos en paquetes para poder enviarlos a través de una IP.

El sistema NAS es fácil de ampliar, puesto que solo hay que añadirle más discos duros, tiene buen rendimiento, ya que se puede ajustar a usos específicos, tiene una configuración sencilla, viene con aplicaciones y un sistema operativo instalado y listo para usar y cuenta con tolerancia a errores configurable.

Almacenamiento de objetos

El almacenamiento de objetos consiste en dividir los datos en unidades independientes, combinadas con metadatos e identificadores únicos, para ofrecer información sobre su contenido y facilitar así su búsqueda y recuperación.

Cuando se almacenan datos en objetos, estos ni se cifran ni se comprimen y se distribuyen entre el hardware, guardándose en un solo repositorio. De manera que cada repositorio contiene los datos, el identificador único y los metadatos que describen los datos. La búsqueda se facilita y aligera gracias al uso combinado de los identificadores y los metadatos.

Para poder usar este tipo de almacenamiento es necesaria una API de http. Y es el sistema de almacenamiento recomendado para datos estáticos que no se van a tener que modificar (porque no podría hacerse). Además, es fácilmente escalable.

Almacenamiento de archivos

El almacenamiento de archivos es el que aquel organiza los datos como archivos jerárquicos, a los que los usuarios pueden acceder y explorar completamente. Es decir, los datos se guardan en carpetas ordenadas de forma jerárquica. En este caso, los metadatos asociados son muy limitados, pudiendo accederse a ellos a través de identificadores únicos, como son el nombre del archivo, la ubicación o una dirección URL.

El almacenamiento de archivos es el más utilizado en sistemas NAS, sin embargo, no son los que ofrecen mejor rendimiento (las búsquedas recorren toda la jerarquía desde el principio hasta el final) y para ampliarlo, es necesario agregar más sistemas y no capacidad.

Almacenamiento en bloques

El almacenamiento en bloques divide los datos en bloques y almacena estos en partes separadas, de manera que cada bloque tienen un identificador único y puede colocarse donde el sistema lo considere más conveniente.

Los bloques quedan «separados» del entorno del usuario y distribuidos en múltiples entornos, que permiten un mejor aprovechamiento de los datos. Cuando el usuario solicita unos datos, el software de almacenamiento empleado busca los bloques de datos y los ensambla para presentarlos al usuario.

Este sistema es más rápido que el de archivos, puesto que la ruta de acceso a los datos es múltiple. Además, cada bloque se puede gestionar y configurar de forma individual por el usuario. Está recomendado para el empleo de grandes bases de datos, pero es más costoso y tiene una capacidad limitada para el manejo de metadatos.

¿Qué dispositivos de almacenamiento de datos existen?

En lo que se refiere a almacenamiento de datos y dispositivos para ello, ya hemos adelantado algunos tipos de soporte en nuestro recorrido histórico, pero sobre ellos para ver sus diferencias.

Dispositivos almacenamiento de datos

Dispositivos de almacenamiento de datos magnéticos

Ya vimos que los dispositivos de almacenamiento de datos magnéticos fueron básicamente los primeros sistemas de almacenamiento de datos.

Estos soportes se basan las propiedades magnéticas de los materiales con los que están hechos para grabar la información digital. Son dispositivos de almacenamiento de datos magnéticos la unidad de cinta magnética, los disquetes o los discos duros.

En este tipo de dispositivos a los datos se accede siguiendo el orden en que fueron escritos, es decir, se recorre el disco hasta que se encuentra el archivo buscado.

Dispositivos de almacenamiento de datos ópticos

Los dispositivos de almacenamiento de datos ópticos se basan en la tecnología láser para grabar los datos digitales sobre superficies plásticas, así como para leerlos. Ejemplos de este tipo de dispositivos son los CD, los DVD o los Blu-ray.

El acceso a los datos en este tipo de dispositivos es igual que con los magnéticos, se hace en orden secuencial.

Dispositivos de almacenamiento de datos semiconductores

Los dispositivos electrónicos semiconductores están implementados en un circuito integrado, se trata de memorias digitales empleadas para el almacenamiento de datos. Lo que las diferencia de los anteriores es su propiedad de acceso aleatorio, es decir, que puede acceder a los datos en cualquier ubicación de la memoria, lo que la hace más rápida y eficiente.

Este tipo de memorias se divide en dos tipos: RAM (random-access memory, memoria de acceso aleatorio) y ROM (read-only memory, memoria de solo lectura).

La memoria RAM es un tipo de memoria volátil, es decir, los datos se pierden cuando el chip de memoria deja de recibir electricidad. Podríamos decir que es la memoria a corto plazo de nuestro ordenador. Por ejemplo, los datos almacenados en caché utilizan un tipo de esta memoria, el SRAM.

La memoria ROM es no volátil y los datos se guardan incluso cuando se apaga el equipo. Por ello, es la memoria empleada en equipos portátiles que carecen de disco duro o tarjetas de memoria externa.

Sistemas de archivos

El almacenamiento de datos en informática sería bastante caótico e inmanejable si no existiese una forma de estructurar y organizar tanto la escritura la lectura, búsqueda, edición y eliminación de los mismos. Para ello están los sistemas de archivos.

El sistema de archivo es el sistema que emplea el dispositivo de almacenamiento para guardar los archivos, pero que a su vez permite al usuario acceder a ellos de forma rápida y sin lugar a error.

Además, los sistemas de archivo dan a los archivos las convenciones mediante las que se nombran, los atributos y el control de acceso. Y son la interfaz entre el sistema operativo y el resto de dispositivos conectados al equipo.

Actualmente, los dispositivos de almacenamiento ya vienen formateados de fábrica, pero en el pasado era habitual tener que darles formato antes para poder instalar un sistema de archivo.

Existen diversos sistemas de archivos, algunos más usados que otros y en función del sistema operativo que se emplee, además, se han empezado a crear sistemas de archivos diseñados específicamente para las últimas tecnologías de almacenamiento, como los SDD.

En cualquier caso, los sistemas de archivo más habituales son FAT16, FAT32, exFAT y NTFS para Windows, HFS+ y APFS para macOS y Mac OS X) y ext4 para Linux.

Unidades de información

Las unidades de información son la forma en la que se mide la capacidad de almacenamiento de los dispositivos de memoria. También se emplea para calcular la capacidad de procesamiento de datos.

Las unidades de información tienen la siguiente escala (de menor a mayor)

  • El bit es la unidad mínima de información que se emplea en informática.
  • Un byte (B) equivale a 8 bits.
  • Un kilobyte (KB) son 1024 B
  • Un megabyte equivale a 1024 KB
  • Un Gigabyte (GB) son 1024 MB (actualmente es la medida que usamos para DVD, Blu-ray, pendrives, tarjetas SD y HDD y SDD de menos de 1 TB).
  • Un terabyte equivale a 1024 GB (ahora es habitual encontrar HDD y SDD de 1, 2 o más TB de capacidad).
  • Un petabyte (PB) equivale a 1024 TB (aún no se emplea mucho fuera de empresas que manejan grandes volúmenes de datos).

Existen aún 5 unidades de medidas mayores, pero no se emplean por el momento.

Resumen

En resumen, el almacenamiento de datos y los dispositivos de data storage son elementos clave para poder archivar, organizar, acceder y manejar los datos en cualquier tipo de sistema. Su evolución a lo largo del tiempo, junto al desarrollo de las nuevas tecnologías, ha permitido ese proceso de archivo, distribución y acceso a la información se cada vez más eminente, los dispositivos de almacenamiento tengan mayores capacidades o que incluso se pueda prescindir del almacenamiento físico gracias a la nube y la virtualización.

Toda empresa y toda persona acceden a archivos de información a través de sus dispositivos, sin los sistemas de almacenamiento de datos, los softwares y hardwares que los hacen posible, no podríamos guardar los números y direcciones de nuestros contactos, guardar un trabajo en un documento de Word, ver un vídeo en YouTube o tener disponibles todas las facturas del año anterior de un cliente en concreto, entre otras muchas acciones que llevamos a cabo en nuestro día a día.