2.4 Fragmentación y distribución de datos
El problema de fragmentación se refiere al
particionamiento de la información para distribuir cada parte a los diferentes
sitios de la red, como se observa en la Figura 3.2. Inmediatamente aparece la
siguiente pregunta: ¿cuál es la unidad razonable de distribución? Se puede considerar
que una relación completa es lo adecuado ya que las vistas de usuario son
subconjuntos de las relaciones. Sin embargo, el uso completo de relaciones no
favorece las cuestiones de eficiencia sobre todo aquellas relacionadas con el
procesamiento de consultas.
El diseño de una base de datos distribuida, cualquiera
sea el enfoque que se siga, debe responder satisfactoriamente las siguientes
preguntas:
·
¿Por
qué hacer una fragmentación de datos?
·
¿Cómo
realizar la fragmentación?
·
¿Qué
tanto se debe fragmentar?
·
¿Cómo
probar la validez de una fragmentación?
·
¿Cómo
realizar el asignamiento de fragmentos?
·
¿Cómo
considerar los requerimientos de la información?
La otra posibilidad es usar fragmentos de relaciones
(sub-relaciones) lo cual favorece la ejecución concurrente de varias
transacciones que accedan porciones diferentes de una relación. Sin embargo, el
uso de sub-relaciones también presenta inconvenientes. Por ejemplo, las vistas de
usuario que no se pueden definir sobre un solo fragmento necesitarán un
procesamiento adicional a fin de localizar todos los fragmentos de una vista.
Aunado a esto, el control semántico de datos es mucho
más complejo ya que, por ejemplo, el manejo de llaves únicas requiere
considerar todos los fragmentos en los que se distribuyen todos los registros
de la relación. En resumen, el objetivo de la fragmentación es encontrar un nivel
de particionamiento adecuado en el rango que va desde tuplas o atributos hasta
relaciones completas.
La relación J se puede fragmentar horizontalmente
produciendo los siguientes fragmentos.
J1: proyectos
con presupuesto menor que $200,000
JNO JNOMBRE
PRESUPUESTO LUGAR
J1
Instrumentación 150000 Monterrey
J2 Desarrollo de
bases de datos
135000 México
J2: proyectos
con presupuesto mayor que o igual a $200,000
JNO JNOMBRE
PRESUPUESTO LUGAR
J3 CAD/CAM
250000 Puebla
J4 Mantenimiento
310000 México
J5 CAD/CAM
500000 Guadalajara
- Fragmentos:
cada relación global puede ser dividida en porciones que no se solapen llamados
fragmentos. El mapa resultante se denomina esquema
de fragmentación. Una relación global puede dividirse en n fragmentos y un
fragmento sólo puede pertenecer a una relación global. Los fragmentos se
referencian por un nombre de relación global y un subíndice. Por ejemplo Ri
indica el fragmento i de la relación R.
Los fragmentos son porciones lógicas de relaciones globales que pueden
estar físicamente ubicadas en uno o varios nodos de la red. El esquema de ubicación define en qué nodos un fragmento
va a ser almacenado. El tipo de mapa definido en el esquema de ubicación
determina si la BDD es redundante o no. Todos los fragmentos que corresponden a
la misma relación global R y están ubicados en el mismo nodo constituyen la imagen física de una relación global R en el
nodo. Las imágenes físicas se pueden referenciar por el nombre de la relación
global R y un superíndice; por ejemplo, Rj indica la imagen física de la
relación global R en el nodo j.
Por último se denomina copia
de fragmento a la información
de un fragmento en un nodo determinado en un nodo dado, y se denota usando el
nombre de la relación global, un subíndice y un superíndice. Por ejemplo, R3 2
indica copia del fragmento R2 que está ubicado en el nodo 3. Dos imágenes
físicas pueden ser idénticas; se dice entonces que una imagen física es copia
de otra imagen física.