Como ustedes saben, el sistema Flex utiliza una serie de productos de IBM para permitir el despliegue dinámico de servidores para hacer que el sistema se basa más fácil. En nuestro caso se han utilizado los nodos de poder ejecutar AIX, el almacenamiento y VMControl/V7000 FSM, que habla de TPC. Hemos experimentado un problema que no se podía desplegar servidores a través de este sistema y todos los problemas parecen apuntar a un problema con el TPC. Así que hice una prueba de mi propia para tratar de rastrear lo que el problema estaba relacionado también, y de esto yo era capaz de reproducir un fracaso de la implementación a través de SCE. Este es el mensaje -
[VMControl] Carga de Trabajo < name> se ha creado.
[VMControl] Comenzar el trabajo asynch una duración de despliegue de aplicación virtual: 150486
[VMControl] Carga de Trabajo eliminado debido a excepción: 157734
[VMControl] Carga de Trabajo < name> se ha eliminado.
[VMControl] Error al desempeñar su trabajo asynch una duración de despliegue de la aplicación virtual: 150486
[VMControl] Error:. Com . ibm ense mble . servicio . ver núcleo . api . EME xcep ción : DNZEMC766E Ha ocurrido un problema. Excepción encontrado: com. ibm. dire ctor im.. comm on.e xcep ción s.De estratagema Exce PtiO n: No volúmenes fueron atribuidas y asignadas. SALIR DE LA FUNCIÓN
[VMControl] DNZVMP547I Un error fue recibida al procesar la solicitud de crear servidor virtual, Gerente Flex System intentará revertir la solicitud mediante la eliminación de los recursos asignados al servidor virtual. La información detallada sobre el proceso de restauración se escribirá en el registro de errores.
[VMControl] DNZVMP548I El procesamiento de nuevo rollo fue un éxito,
[VMControl] DNZVMP510E Crear solicitud Virtual Server Error de host, < power-host> .
[VMControl] nueva carga de trabajo eliminado: 157734
También me doy este mensaje como parte de la falla a través de implementaciones KVM -
30 de noviembre 2012 01:30:02 PM GMT- Leve l: 15 0-ME ID: 0 - MS G: DNZVMS606I La operación de despliegue de dispositivo virtual '< nombre> 'al servidor' < > Servidor 'ha comenzado.
El aparato cuenta con ID 'Aad FC70 7-28 67-4 B76- B902 -424 8b3a 9d5d b '.
30 de noviembre 2012 01:30:02 PM GMT- Leve l: 15 0-ME ID: 0 - MS G: Mapeo DNZVMS644I disco preparado de "disk1" imagen de 'SAN' disco '< almacenamiento> : < nombre> ' con capacidad de 10240 MB. Appliance imagen para copiar - 'true'
30 de noviembre 2012 01:30:05 PM GMT- Leve l: 20 0-ME ID: 0 - MS G: Subtarea estado de activación ha cambiado a " Activo con errores " .
30 de noviembre 2012 01:30:05 PM GMT- Leve l: 1 - MEID :0 - MSG: estado de los trabajos de activación ha cambiado a " Activo con errores " .
30 de noviembre 2012 01:30:05 PM GMT- Leve l: 15 0-ME ID: 0 - MS G: DNZVMS604I Post-procesamiento de despliegue se ha iniciado.
30 de noviembre 2012 01:30:05 PM GMT- Leve l: 50 -MEI D: 0 - MSG- : DNZVMS201E La operación de despliegue falló. El mensaje de error "La operación DNZVMS201E despliegue fallido . El mensaje de error es 'RuntimeException -. DNZCIR880E Comando svs creación Tevi rtua lMul Tidi sk () no se ha ejecutado correctamente. Mensaje devuelto es com. ibm. dire ctor ser. vicio s.st orag e.vi rtua liza ción SVS. Exce PtiO n: No volúmenes fueron atribuidas y asignadas. FUNCIÓN DE SALIDA, Trace-walkback:
. com . ibm dire ctor .. im cr.S tora Gema nage Rada PTER . cal lCre ateV MD (S tora Gema nage Rada PTER jav. A: 11 23)
com.ibm.director.vmc.svpc.image.MultiDiskStorageMapping.allocateAndCollectDisksIntoDG(MultiDiskStorageMapping.java:427)
Mirando los logs en / opt / ibm / dir ecto r / lw i / lo g / er ror- log- 0.ht ml mostró el siguiente error con TPC -
03/12/2012 10:54:24.383 GRAVE TPC mensaje de fallo : :: Th leer = Hombre envejecido Thre ADPO ol-t HREA d-0 :: lo gger nombre = com . ibm . dir ecto r.se rvic es.s tora ge.v irtu aliz ació n
03/12/2012 GRAVE 10:54:24.384 - TPCAPI CREA prueba orag Evol menes fallidos con los siguientes parámetros:
volsize = 107374182400
poolID = 0,000 0.200 A021 86B8 : 0 0 0 000 200 A 0218 6B8 + 0
newVolName = null
:: Th leer = Hombre envejecido Thre ADPO ol-t HREA d-0 :: lo gger nombre = com . ibm . dir ecto r.se rvic es.s tora ge.v irtu aliz ació n
03/12/2012 10:54:24.385 GRAVE La variable storageVolRefs es nulo o vacío. No hay volúmenes puede haber sido asignado.
::class.method=com.ibm.director.services.storage.virtualization.tasks.CreateVirtualMultiDiskTask.createVMD() ::thread=ManagedThreadPool-thread-0 ::loggername=com.ibm.director.services.storage.virtualization
03/12/2012 10:54:24.385 Excepción grave fue golpeado mientras se realiza la operación createVMD para:
< --------------
Nombre del parámetro: SVSC reat eVMD Sema ntic Obje ct
Fuente: Servidor: 1 * 7895-42X * 102F10B / < violencia servidor> / Guid: 7402 50CF A45A 3EEA BDA7 A819 36C2 F0F8
Dedicado: {11}
Bombo RVIS orPl atfo rmTy pe: 8
Arquitectura: ppc64
Virtual: true
DirecciónIPv4: {'172 .19.118.4 '}
DiskGroupName: null
DiskGroup: null
-------------- />
< --------------
Nombre del parámetro: SVSC reat eVMD Sema ntic Obje ct
Fuente: Servidor: 2 * 7895-42X * 102F10B / < violencia servidor> / Guid: 4712 036A 7F18 3EE2 A1AA C3A9 1F27 CC2E
Dedicado: {11}
Bombo RVIS orPl atfo rmTy pe: 8
Arquitectura: ppc64
Virtual: true
DirecciónIPv4: {'172 .19.118.5 '}
DiskGroupName: null
DiskGroup: null
-------------- />
< --------------
Nombre del parámetro: SVSV irtu Almu ltid iskR ecuación
LabelPrefix: null
Ruta de acceso: null
Tamaño: 102400
Formato: null
Política de Almacenamiento:
< --------------
Nombre del parámetro: SVSStoragePolicy
SVSStoragePolicy: null
Criterios establecidos:
< --------------
Nombre del parámetro: SVSS tora gepo lítica Crítico eria
AFFINITY: StoragePool: 0000 0 200 A021 86B8 : 0 0 0 000 200 A 0218 6B8 + 0/md iskg RP0 / Guid : A64D 1CD2 CD28 3D2A 9643 C914 C79A 7AF1
Rema inin Gman edad Spac e: 6575863365632
RaidLevel: -1
LargestSlice: 6575863365632
peso falso: negociable 1
Mirando los logs del TPC para ese evento almacenamiento muestra lo siguiente -
# Cat / opt / IBM / TPC / dev hielo / log / msg. cont rol. 3,143 mil 0.316 7.lo g
03/12/2012 10:54:21.816 BTACS0000I controlar el arranque del proceso: CREA prueba orag Evol menes , Device Server se ejecutan ID = 3143, Job ID = 3167.
03/12/2012 10:54:22.128 HWNEP0115I A partir de Control de Procesos para el sistema de almacenamiento < > Almacenamiento .
03/12/2012 10:54:23.362 HWNEP0111E La conexión con el dispositivo de almacenamiento fallado. El código de error es 5.
03/12/2012 10:54:23.575 HWN021503E producido un error interno, por favor, inténtelo de nuevo. Si el problema persiste, póngase en contacto con el servicio de IBM.
03/12/2012 10:54:23.577 BTACS0001I Finalizado Proceso de Control: Device Server RUN ID = 3143, Job ID = 3167, Status = 0, código de retorno = -1.
A continuación, el directorio / opt / IBM / TPC / dev hielo / log / audi TTPC Devi CESE RVer . log muestra un problema similar -
03/12/2012 10:54:21.817 +00:00 BTACS0047I disco de Maná Gers ervi ce.c reat ESTO rabia Volu men realizado por db2inst1 a < flex> . Los parámetros de entrada: [[107374182
400], [000 0020 0A02 186B 08:00 + 0000 0200 A021 86B8 0], null, null], los parámetros de salida. JobID 3143 = com . ibm . tpc Serv ICEU TIL recordInAuditLog
03/12/2012 10:54:21.834 +00:00 BTACS0047I disco de Maná Gers ervi ce.g Etjo BSTA Tus realizado por db2inst1 a < flex> . Los parámetros de entrada: [3143], párr salida metros: . JobID 3143 = com . ibm . tpc Serv ICEU TIL recordInAuditLog
03/12/2012 10:54:23.870 +00:00 BTACS0047I disco de Maná Gers ervi ce.g Etjo BSTA Tus realizado por db2inst1 a < flex> . Los parámetros de entrada: [3143], párr salida metros:
TPCA sincronización Resu lt @ 6 4 766 cuatrocientos setenta y seis:
Estado = 0, JobId = 3143, RETURNCODE = -1,
Message = HWN021503E producido un error interno, por favor, inténtelo de nuevo. Si el problema persiste, póngase en contacto con el servicio de IBM.
ReturnException = com. ibm. tpc. comm on.a pi.T PCSE RVer Exce PtiO n: HWN021503E producido un error interno, por favor, inténtelo de nuevo. Si el problema persiste, póngase en
Mirando hacia atrás en los registros anteriores, podemos ver que en el 11/27/2012 hubo un succ FEES ul un lloc ació n de almacenamiento a las 11:16 después de un fracaso a las 10:47 -
-Rw-r - r -. 1 root root 1137 27 de noviembre 10:16 msj cont rol. 3,122 0,312 5.lo g
-Rw-r - r -. 1 root root 617 27 de noviembre 10:47 msj cont rol. 3,123 0,312 6.lo g
# Cat / opt / IBM / TPC / dev hielo / log / msg. cont rol. 3 mil ciento veintidós .312 5.lo g
27/11/2012 10:16:44.796 BTACS0000I controlar el arranque del proceso: Unas signo Stor AGEV olum ESFR omWW PN, Device Server RUN ID = 3122, Job ID = 3125.
27/11/2012 10:16:45.192 HWNEP0115I A partir de Control de Procesos para el sistema de almacenamiento < > Almacenamiento .
27/11/2012 10:16:46.424 HWNEP0124I Iniciado desasignación de volumen < > imagen de subsistema < > Almacenamiento para albergar < host> _hba1.
27/11/2012 10:16:46.489 HWNEP0125I Finalizado desasignación de volumen < > imagen de subsistema < > Almacenamiento para albergar < host> _hba1
27/11/2012 10:16:46.727 HWNEP0124I Iniciado desasignación de volumen < > imagen de subsistema < > Almacenamiento para albergar < host> _hba1.
27/11/2012 10:16:46.727 HWNEP0125I Finalizado desasignación de volumen < > imagen de subsistema < > Almacenamiento para albergar < host> _hba1.
27/11/2012 10:16:47.927 proceso HWNEP0019I externa para dispositivos < > Almacenamiento completado con éxito.
27/11/2012 10:16:50.182 BTACS0001I Finalizado Proceso de Control: Device Server RUN ID = 3122, Job ID = 3125, Status = 1, código de retorno = 0.
Así que mirando atrás en el audi TTPC Devi CESE RVer registrar. tal vez podamos ver dónde falla y cuál es el mensaje -
27/11/2012 10:47:23.638 +00:00 BTACS0047I disco de Maná Gers ervi ce.g Etjo BSTA Tus realizado por db2inst1 a < flex> . Los parámetros de entrada: [3123], la salida párrafo
m:
TPCA sincronización Resu lt @ 6 21a6 21a:
Estado = 0, JobId = 3123, RETURNCODE = -1,
Message = HWN021503E producido un error interno, por favor, inténtelo de nuevo. Si el problema persiste, póngase en contacto con el servicio de IBM.
ReturnException = com. ibm. tpc. comm on.a pi.T PCSE RVer Exce PtiO n: HWN021503E producido un error interno, por favor, inténtelo de nuevo. Si el problema persiste, póngase en
Una repetición del mensaje anterior.
Así que buscando en el directorio / opt / IBM / TPC / dev hielo / log / DMSV Ctra. ce.l lo og parece ser cuestión autorización TPC -
27/11/2012 10:38:49.841 +00:00 conexión HWN099993E failed.172.19.67.61 @ (-9 2233 7203 6854 5260 09; [ -922 3372 0368 5448 1870 , 0,0 ]; -9 2233 7203 6854 4818 69; p ool- 2003 -tr -ead 1)
. com . ibm . tpc comm on.a pi.n . api NAPI Conn ECTI Onex concepto ion: rc = 5, mensaje Autenticación = fracasado.
. en com . ibm . tpc comm on.a pi.n . api NAPI SVCC Onne x io n.op Ense EVOI n (NA PISV ccon nect de iones. java : 84)
. en com . ibm . tpc disco . com . lun NAPI Mana . ger Obtiene VCCO NNEC ción de estadísticas por nosotros (N APIM anag er.j ava: 2781 )
. en com . ibm . tpc disco . com . lun NAPI Mana . ger prueba SSCO NNEC ción (NAP IMan ager jav. A: 25 20)
. en com . ibm . tpc disco . com . lun NAPI Mana ger $ 1.ca ll (N APIM anag er.j ava: 2464 )
. en com . ibm . tpc disco . com . lun NAPI Mana ger $ 1.ca ll (N APIM anag er.j ava: 1)
en java . uti l.co ncur alquiler . Fut Uret pedir $ Sync posada. ERRU n (Fu tura de tareas jav. un: 28 4)
en java . uti l.co ncur alquiler . Fut Uret preguntar. ejecutar ( Futu RETA sk.j ava: 138)
en java uti. l.co ncur alquiler Thr. EADP oole xecu tor $ Trabajo er.r UNTA sk (T HREA dPoo lExe cuto r.ja va: 6 78)
en java . uti l.co ncur alquiler . Thr EADP oole xecu tor $ Trabajo er.r Naciones Unidas (T HREA dPoo lExe cuto r.ja va: 7 03)
en java . lan g.Th leer correr. (Thr ead. java : 811 ). com . ibm . tpc disco . com . lun NAPI Mana ger Obtiene VCCO NNEC ción de estadísticas por nosotros
27/11/2012 10:38:49.843 +00:00 HWN099990I El método de ensayo Stor las edades ubsy madre s del servicio Administrador de discos devueltos [AUTHFAILED] @ (-922 3372 0368 5452 6015 , [-9 2.233 7.203 6.854 4.818 77,0 , 0]; -922 3372 0368 5448 1876 ; Web Cont aine r: 5). com. ibm. tpc. disco . api . imp l.Di skMa nage rSer vice prueba Stor las edades ubsy madre s
De esto podemos concluir que hay un problema con el acceso de TPC para el Control de almacenamiento en V7000, por lo que permite recrear la llave y volver a crear la fuente de almacenamiento de datos y habilitar los servicios de almacenamiento de copia.
fsm: ~ # ssh-keygen
Generar par de claves RSA pública / privada.
Introduce archivo en el que guardar la clave (/ ho me / U SERI, D / .S sh / i d_rs a) :/ home / USO RID / . ssh / id_ rsaV 7000
Enter passphrase (vacío sin contraseña):
Introduzca misma contraseña de nuevo:
Su identificación se ha ahorrado en / hom e / EE.UU. ERID /. ss h / id _rsa V700 0.
Su llave pública se ha ahorrado en / hom e / EE.UU. ERID /. ss h / id _rsa V700 0.pu b.
La huella digital es la siguiente:
---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- ---- - - ---- ---- ---- ---
La clave de la imagen randomart es:
+ - [RSA 2048] ---- +
| |
| |
| |
| |
| |
| |
| |
| |
| |
+ ----------------- +
fsm: ~ # smcli rmdatasource svc-c-i < dirección ip
Extracción de fuente de datos ...
La fuente de datos se ha eliminado correctamente.
fsm: ~ # smcli mkdatasource svc-c-f / hom e / EE.UU. ERID . / ss h / id _rsa V700 V7000 0-v-i < ip-address>
Adición de la fuente de datos ...
La fuente de datos fue agregado con éxito.
fsm: ~ # smcli lssys-t Granja
< nombre de host>
fsm: ~ # smcli collectinv-p " Todos inventario " -t Granja
Inventario porcentaje colección 0%
Inventario porcentaje de recogida 50%
Inventario porcentaje de recogida 75%
Inventario porcentaje de recogida 99%
Inventario colección completa:
100%
fsm: ~ # smcli collectinv-p " Todos inventario " -i < ip-address>
Inventario porcentaje colección 0%
Inventario porcentaje de recogida 17%
Inventario porcentaje de recogida 26%
Inventario porcentaje de recogida 31%
Inventario porcentaje de recogida 34%
Inventario porcentaje de recogida 53%
Inventario porcentaje de recogida del 87%
Inventario porcentaje de recogida 91%
Inventario porcentaje de recogida del 93%
Inventario porcentaje de recogida 95%
Inventario porcentaje de recogida 98%
Inventario colección completa:
100%
fsm: ~ # smcli mksvcsshrsap-s " < almacenamiento-name> " -u idusuario-f / hom e / EE.UU. ERID . / ss h / id _rsa V700 0
Comando completado con éxito.
Después de esto fue una vez más capaz de capturar y desplegar servidores de nuevo tanto para KVM, el poder y pude confirmar esto a través de los registros también -
fsm: ~ # cat / opt / IBM / TPC / dev hielo / log / . msj cont rol. 3 mil ciento cincuenta 0,317 7.lo g
03/12/2012 14:22:15.081 BTACS0000I A partir de Control de Procesos: CREA prueba orag Evol menes , servidor de dispositivos RUN ID = 3150, Job ID = 3177.
03/12/2012 14:22:15.400 HWNEP0115I A partir de Control de Procesos para el sistema de almacenamiento < > Almacenamiento .
03/12/2012 14:22:16.649 HWNEP0120I Iniciado creación de volumen con el tamaño 107374182400 en la piscina en mdiskgrp0 subsistema < almacenamiento>
03/12/2012 14:22:16.837 creación del volumen HWNEP0121I completado con éxito. Nuevo volumen 38 creado con el tamaño 107374182400 en la piscina en mdiskgrp0 subsistema < almacenamiento>
03/12/2012 14:22:17.534 proceso HWNEP0019I externa para dispositivos < almacenamiento-flex> completó con éxito.
03/12/2012 14:22:17.728 BTACS0001I Finalizado Proceso de Control: Device Server RUN ID = 3150, Job ID = 3177, Status = 1, código de retorno = 0.
No hay comentarios:
Publicar un comentario