Portada » Informática » Conceptos Esenciales de Bases de Datos Distribuidas y Computación en Malla
Las formas principales de conexión de las localidades en una Base de Datos son:
La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la información de una forma fiable y eficaz.
Algunas de las desventajas de la distribución de datos incluyen:
Los tres tipos de fragmentación de datos son: Horizontal, Vertical e Híbrida.
Las reglas principales de corrección de la fragmentación son: Compleción, Reconstrucción y Disyunción.
El problema de fragmentación se refiere al particionamiento de la información para distribuir cada parte a los diferentes sitios de la red.
Los sistemas de Bases de Datos centralizados se ejecutan en un único sistema, sin interaccionar con ninguna otra computadora. Tales sistemas comprenden desde los SBD mono-usuarios ejecutándose en una PC, hasta los SBD de alto rendimiento ejecutándose en grandes sistemas.
La estructura de la Base de Datos Distribuida consiste en un conjunto de localidades, donde cada localidad puede procesar transacciones locales o transacciones globales entre varias localidades, requiriendo para ello comunicación entre ellas.
Las razones para construir un sistema distribuido de Base de Datos son: compartir información, fiabilidad, disponibilidad y agilizar el procesamiento de consultas.
Ante el usuario, un sistema distribuido debe lucir exactamente igual que un sistema que no es distribuido.
Las 5 reglas u objetivos que rigen el principio fundamental de un Sistema Distribuido son:
El diseño de la distribución implica la toma de decisiones sobre la ubicación de los programas que accederán a la Base de Datos y sobre los propios datos que constituyen esta última, a lo largo de los diferentes puestos que configuren una red de ordenadores.
A la hora de abordar el diseño de una Base de Datos Distribuida, se pueden optar principalmente por dos tipos de estrategias: la estrategia ascendente y la estrategia descendente.
La Computación en Grid (o en Malla) es un nuevo paradigma de computación distribuida en el cual todos los recursos de un número indeterminado de computadoras son englobados para ser tratados como una única supercomputadora de manera transparente.
El Sistema Grid consiste en compartir recursos heterogéneos, basados en distintas plataformas, arquitecturas de equipos, programas y lenguajes de programación.
Un ejemplo de proyecto de computación Grid en el cual trabajan computadoras alrededor del planeta para buscar vida extraterrestre es SETI@home.
La computación de ciclos redundantes consiste en que un servidor o grupo de servidores distribuyen el trabajo de procesamiento a un grupo de computadoras voluntarias a ceder capacidad de procesamiento no utilizada.
El método Clustering consiste en un grupo de computadoras de relativo bajo costo, conectadas entre sí mediante un sistema de red de alta velocidad.
Los computadores de un sistema distribuido se comunican entre sí a través de diversos medios de comunicación, tales como cables de alta velocidad o líneas telefónicas. No comparten la memoria principal ni el reloj.
En el modelo de arquitectura para las máquinas paralelas, el concepto de Memoria Compartida implica que los procesadores y los discos tienen acceso a una memoria común (a través de un bus o de una red de conexión).
En un sistema de disco compartido, todos los procesadores comparten un conjunto de discos común. Algunas veces se denominan agrupaciones.
La organización de los Sistemas de Bases de Datos Distribuidos se ha clasificado tradicionalmente sobre tres dimensiones:
Si el sistema es transparente en cuanto a repetición y fragmentación, se ocultará al usuario gran parte del esquema de la Base de Datos Distribuida.
En el caso más general, el problema de actualización de información replicada y fragmentada está relacionado con el problema de actualización de vistas.
Los sitios en un sistema distribuido deben ser autónomos.
Las 4 categorías de información necesaria son:
El criterio principal para determinar el costo de una estrategia específica es el número de accesos al disco en un sistema centralizado.
Aunque la consulta es muy simple, su procesamiento no es trivial, ya que es posible que la relación de depósito esté fragmentada, replicada o ambas cosas.
Todo elemento de información de una Base de Datos debe tener un nombre único.