| Otras Ediciones: |
- EDITORIAL
- EXA: Una categoría superior de “Geeks”
- HISTORIAS DE EXITO
- Panamá lidera servicios de tercerización de IT
- Innovación en agencias bancarias en Costa Rica
- TENDENCIAS
- ¿Se encuentra segura su información?
- El nuevo integrador de valor
- IBM Service Delivery Platform (SDP)
- Datos correctos / lugar correcto / momento correcto
- Calidad de datos inteligente
- Los 10 hechos IT de la década
- UN MUNDO MÁS INTELIGENTE
- Una alimentación más sana para un planeta más inteligente
- Energía más inteligente para un planeta más inteligente
- ESPECIAL
- EXA - Forum 2010
- HARDWARE SOFTWARE SERVICIOS
- Mejores prácticas de seguridad en plataformas de banca en línea
- Cuotas de impresión
- Los sistemas disponibles mantienen contentos a los clientes
- GEEK
- PORTADA
Fuente: www.ibm.com/developerworks/data/dmmag/
Hoy en día, los DBAs han tenido poco que decidir en cuanto a donde viven sus bases de datos: ellos simplemente solicitaban una cantidad de espacio de almacenaje y el administrador de almacenamiento se lo proveía.
Ahora, sin embargo, es importante para los DBAs pensar en los tipos de almacenamiento que usan porque almacenamiento no es más “solo almacenamiento”. Hay velocidades rápidas, lentas, intermedias y cada una de estas es preferible para diferentes usos.
El reto está en decidir dónde poner los datos para obtener el mejor retorno de inversión. Este articulo explorará cómo crear un acercamiento integral con IBM DB2 para z/OS y obtener la meta de tener los datos correctos en el lugar adecuado al tiempo adecuado para mejorar el rendimiento de la optimización y reducir el costo total de propiedad (CTP).
Nunca antes un DBA de DB2 se ha enfrentado a tantas opciones de almacenamiento con tantas variables de rendimiento y precio. En el alto rendimiento, los discos de estado sólido (Solid State Drives), los cuales pueden soportar patrones de acceso aleatorio de I/O con una razón de 5000 operaciones I/O por segundo (IOPS), son una opción atractiva para aplicaciones demandantes y de I/O intensos. Sin embargo, estos pueden ser relativamente caros.
En el otro lado de la escala, los discos Serial Ata (SATA) pueden ser tan grandes como 2TB pero típicamente brindan apenas unos 75 IOPS. Estos tienen un rendimiento razonablemente bueno para cargas de trabajo secuenciales pero no son tan buenos con los patrones de acceso aleatorio de I/O.
Entre estos dos extremos, se encuentran los comúnmente utilizados discos de canales de fibra (FC) que han sido la columna vertebral de arreglos empresariales de almacenamiento por muchos años. Los discos FC permiten 180 IOPS con un tiempo de respuesta aceptable (menos de 5ms). Las capacidades de estos discos están creciendo muy rápido pero para que llegaron a un tope de velocidad y respuesta.
Sin embargo, los dispositivos individuales son solamente parte de la ecuación. Discos de todo tipo son colocados en arreglos de almacenamiento empresariales de formas en que entregan diferentes razones de precio/ desempeño. Por ejemplo, RAID-10 (espejos segmentados) tienen mejor rendimiento pero cuesta más que un RAID-5. Igualmente el RAID-5(segmentado de paridad simple) tiene algunas ventajas de rendimiento sobre el RAID-6(segmentado de paridad doble), sin embargo RAID-6 provee una mayor protección contra pérdida de datos.
Usted podría tener algunos o todos estos tipos de almacenamiento disponibles o puede tener otras variaciones. Cualquiera que sea su ambiente, inicie su plan de escalonamiento definiendo sus niveles. Almacenamiento de alto costo o alto rendimiento se vuelve el nivel de protección (Tier) oro, seguido por los menos costosos niveles plata y bronce.
Si definir niveles de almacenamiento es relativamente sencillo, colocar los datos correctos en estos normalmente no lo es. La decisión inicia con una gran cantidad de parámetros del proyecto: ¿Es la base de datos crítica para el negocio? ¿Cuáles son los requerimientos de rendimiento? ¿Cuáles son los requerimientos de disponibilidad?
A partir de ahí, las clasificaciones se vuelven más complicadas. En un único sistema DB2, no todos los datos son lo mismo; tiene sentido tener los datos de una base de datos almacenada, en parte, en cada nivel de protección. Incluso dentro de los datos de producción, algunas tablas son accesadas raramente mientras otras son accesadas continuamente. En un giro final, los perfiles de acceso pueden variar con el tiempo (ver Figura 1).
También se requiere considerar las características de I/O que requiere su carga de trabajo. ¿Es aleatoria o secuencial? ¿escritura o lectura? ¿Cuáles son las razones de escritura/ lectura? ¿Son los I/O pequeños o grandes? Comprender su carga de trabajo le permitirá tomar decisiones apropiadas de niveles de protección del almacenamiento.

Figura 1. El patrón de acceso a los datos, desde la creación a la disposición, usualmente caracterizado como el ciclo de vida de la información.
Las cargas de trabajo tienene diferentes intensidades cuando se ven desde la perspectiva de tiempo y almacenamiento. En adición a la intensidad, el tipo de carga de trabajo puede tener un ligamen con cual el nivel de protección es óptimo para el despliegue. ¡No todos los I/O son iguales!
Considere la operación de escritura: La mayoría de los arreglos de almacenamiento esconden una escritura interna y se retorna por medio de un canal una señal de reconocimiento al dispositivo final. A este proceso usualmente se le refiere como Dispositivo de Acceso directo de Almacenamiento (DASD) de escritura rápida. Posteriormente, la escritura es enviada al almacenamiento físico. En este caso ¿importa qué tipo de almacenamiento existe por debajo? Yéndonos a aguas más turbias, las escrituras desde el bufferpool de DB2 se hacen de forma asincrónica con respecto a la carga de trabajo transaccional y son por lo tanto una prioridad menor que, por ejemplo, las lecturas sincronizadas.
Las cargas de trabajo de lectura secuencial, tales como aquellas generadas durante un escaneo de espacio de tablas, son también interesantes. Cuando DB2 procesa un plan que requiere un escaneo de espacio de tablas, este realiza actividades pre-fetch. Las cuales son lecturas de forma asincrónica de I/O. Cuando el arreglo de almacenamiento detecta esta actividad secuencial, este también realiza pre-fetch leyendo la tabla de datos del caché en el arreglo. Esto convierte el disco en una especie de modo de torrent (streaming) sin interrupciones desde otras solicitudes de I/O del mismo medio de almacenamiento.
En modo de torrente, los discos giratorios son tan buenos, si no mejores, que los discos de estado sólido. El nivel de protección oro tal vez no es la mejor opción para este tipo de carga de trabajo de DB2. De hecho, mover estos datos al nivel oro no sólo no mejoraría el rendimiento, sino que también tomaría espacio valioso que podría ser usado para otras actividades I/O.
Aún cuando seleccionar el nivel de protección para ciertas actividades I/O no sea intuitiva, una medida empírica de la carga de datos puede brindarnos un mejor despliegue de niveles de protección.
La mejor manera de determinar cuál información corresponde a cuál nivel de protección, es por medio de análisis de la información para las tablas del Facilitador de Administración de Recursos (RMF por sus siglas en inglés) para determinar la caracterización I/O. Por ejemplo, cuando buscamos información que podría ser adecuada para los discos de estado sólido, se recomienda examinar el System Management Facility SMF subtipo 42, 6 registros, que muestra las tablas con un tiempo significativo de DCOLLECT. El tiempo elevado de DISC es un indicador de que la página a ser leída no estaba en el cache del controlador de almacenamiento para la lectura sincrónica DB2. Los grupos de datos con un alto rango de tiempo DISC en el intervalo son generalmente los más indicados para mover a discos de estado sólido.
Pero aún cuando se identifica grupos de datos con alto contenido de tiempo DISC (esto es, que están obteniendo “omisiones” de almacenamiento cache), los grupos de datos que tienen los más altos niveles de omisión son usualmente los grupos de datos más grandes porque no pueden ser mantenidos en el almacenamiento cache fácilmente. La densidad de omisión se mide por cuántas pérdidas de cache obtiene por gigabyte de almacenamiento de tablas. Usted puede calcular este valor con una hoja de trabajo usando DCOLLET y los registros SMF.
Otras métricas de los reportes SMF pueden indicar grupos de datos con actividad I/O mínima. Esos grupos de datos podrían ser indicados para la capa bronce de almacenamiento, especialmente si son grandes.
Aunque no se puede ser detallado en este tipo de análisis en este artículo, se pueden generar algunas reglas generales:
- La lectura aleatoria de la actividad I/O es el mayor trabajo para los discos de estado sólido, especialmente la actividad que resulta en muchas omisiones de almacenamiento en caché.
- La actividad secuencial alta es mejor para los discos FC o SATA.
- La actividad de escritura fuerte es la mejor para discos FC sin usar protección de paridad. Si la controladora de almacenamiento tiene problemas de caché, la actividad de escritura fuerte será dirigida a discos de estado sólido ya que las escrituras pueden ser para un disco más rápido que discos FC o SATA.
- La actividad I/O es mejor para discos SATA.
Lo ideal es que los mecanismos de almacenamiento y bases de datos trabajaran automáticamente para identificar la mejor capa para cada dato, y luego mover la información a esa capa – pero no hemos llegado a eso todavía.
Por el momento, se recomienda usar el IBM Data Facility Storage Management Subsystem (DFSMS por sus siglas en inglés) para implementar una metodología de capas manual y rudimentaria. Al construir grupos de almacenamiento que contienen volúmenes de desempeño con características similares, usted puede usar Selección Automática de Clases (ACS por sus siglas en ingles) combinado en con juegos de tipo de almacenamiento para dirigir a la capa más apropiada.
Esto es rudimentario por tres razones: primero, el control de la información es al momento de colocación (cuando se crea el set de información). Esto no toma en consideración el ciclo de vida de la información. Lo que sucede cuando la información ya no se accesa frecuentemente y se vuelve un indicado para una capa de bajo desempeño? Segundo, asume que se saben los requerimientos de desempeño de las tablas anticipadamente. ¿Qué sucede si estos requerimientos son desconocidos y el espacio de tablas se ubica inadvertidamente en la capa equivocada? ¿Cómo lo mueve? También puede ser que solamente alguna parte del espacio de tablas es caliente y el resto es frio, debería existir en varias capas.
Cuando se puede saber que los espacios de tablas poseen requerimientos de desempeño determinantes y persistentes; se puede aplicar una técnica de almacemiento, usando DFSMS. La meta global es empatar las capas de almacenamiento a las características de información I/O. La figura 2 muestra una solución de capas estática simple que se podría implementar usando los grupos de almacenamiento Storage Management Subsystem (SMS por sus siglas en ingles). En realidad, el modelo de capas es raramente tan simple debido a la volatilidad de los patrones de acceso a datos.

Figura 2. Niveles de protección estáticas usando grupos de almacenamiento SMS que empatan niveles de almacenamiento a características de datos.
En cualquier modelo de capas, existen varias formas de mover de manera transparente la información de una capa a otra, sin afectar la disponibilidad de la base de datos:
- Utilitario Reorg DB2: El utilizar Reorg DB2 en línea para mover un espacio para tablas de un disto a otro es simple y efectivo. Controlar a donde va no es así de fácil, pero se puede alcanzar usando el espacio garantizado o al cambiar las rutinas ACS.
- Particionamiento DB2: Una escogencia prudente de una llave de particionamiento puede permitir al DB2 el correr particiones para un espacio de tablas de una capa de almacenamiento a otra al utilizar las herramientas de movimiento de grupo de datos que se lista seguidamente.
- Herramientas de terceros: Estas incluyen IBM Softek TDMF, IBM Softek zDMF, EMC z/OS Migrator, EMC Virtual LUN Migrator, EMC FAST, Hitachi Tiered Storage Manager, FDRPAS, and FDRMOVE. Es importante aclarar que cuando se usan estas herramientas, se debe validar cuáles necesitan, tomando en cuenta si usted necesita mover información a nivel de grupo, de datos o volumen, y si el espacio de tablas de DB2 o volumen se está usando.
Las capas de almacenamiento de DB2 para z/OS puede mejorar el ROI e incrementar la optimización de desempeño, aunque puede ser un peso para los DBs el manejar la estrategia completa. Los DBAs necesitan sistemas de almacenamiento inteligente que puedan actuar automáticamente en ambientes de bases de datos y colocar información a nivel de espacio de tablas (ó a un nivel de granulación menor) en la capa de almacenamiento óptimo basados en los grupos de políticas de usuario. Mientras tanto, es una buena práctica y también potencialmente lucrativa, familiarizarse con las características de almacenamiento que usted solicita o que es asignado, y pensar acerca de la major manera de usarlas.
