Grid Computing consiste en conectar un grupo de or­de­na­do­res de manera de­s­ce­n­tra­li­za­da con el fin de formar un su­pe­ro­r­de­na­dor virtual. La potencia de cálculo di­s­tri­bui­da de manera flexible permite realizar tareas complejas con varios recursos si­mu­l­tá­nea­me­n­te y optimizar el uso de la in­frae­s­tru­c­tu­ra.

Grid Computing: de­fi­ni­ción

El Grid Computing, o co­mpu­tación en malla, es un subgrupo de la co­mpu­tación di­s­tri­bui­da, o di­s­tri­bu­ted computing: un término genérico para in­frae­s­tru­c­tu­ras digitales co­m­pue­s­tas por or­de­na­do­res autónomos co­ne­c­ta­dos entre sí en una red in­fo­r­má­ti­ca. La red in­fo­r­má­ti­ca no suele depender del hardware. De esta manera, es posible integrar en la red or­de­na­do­res con funciones y equi­pa­mie­n­to distintos. Las apli­ca­cio­nes y procesos di­s­tri­bui­dos trabajan entre di­s­po­si­ti­vos con unidades in­fo­r­má­ti­cas en red, las cuales, a su vez, pueden co­mu­ni­car­se entre sí dentro de la red local y entre regiones y resolver problemas.

La frontera entre Di­s­tri­bu­ted Computing y Grid Computing es difusa. La co­mpu­tación di­s­tri­bui­da puede referirse a distintas formas de pro­ce­sa­mie­n­to de datos de­s­ce­n­tra­li­za­do en redes de or­de­na­do­res. Por su parte, Grid Computing, o la co­mpu­tación en malla, designa un su­pe­ro­r­de­na­dor virtual que surge a partir de la fusión de or­de­na­do­res in­de­pe­n­die­n­tes poco acoplados. Se utiliza para llevar a cabo procesos o tareas de alta in­te­n­si­dad co­mpu­tacio­nal. Los se­r­vi­do­res y or­de­na­do­res co­ne­c­ta­dos ponen a di­s­po­si­ción sus recursos y potencia para ofrecer una mejor es­ca­la­bi­li­dad del re­n­di­mie­n­to in­fo­r­má­ti­co necesario.

¿Cómo funciona el Grid Computing?

En Grid Computing, se utilizan los puntos fuertes de los clústeres de or­de­na­do­res de forma su­pra­rre­gio­nal y de­s­ce­n­tra­li­za­da creando redes. Mientras que los clústeres de or­de­na­do­res suelen estar formados por redes in­fo­r­má­ti­cas limitadas al plano local, el Grid Computing accede a las ca­pa­ci­da­des in­fo­r­má­ti­cas dentro de una red de or­de­na­do­res sobre una base su­pra­rre­gio­nal. No solo los or­de­na­do­res están co­ne­c­ta­dos en red, sino también las bases de datos, el hardware y el software, así como las ca­pa­ci­da­des in­fo­r­má­ti­cas. En el grid, los pro­vee­do­res conectan los recursos in­fo­r­má­ti­cos di­s­tri­bui­dos global y lo­ca­l­me­n­te mediante in­te­r­fa­ces (nodos) y mi­d­d­le­wa­re. A co­n­ti­nua­ción, las asignan a or­ga­ni­za­cio­nes virtuales que, a su vez, de­te­r­mi­nan qué recursos pueden hacerse cargo de las tareas o cómo puede di­s­tri­bui­r­se la potencia de cálculo de forma óptima en el marco de una apli­ca­ción.

La co­mpu­tación en malla se utiliza tanto para fines co­me­r­cia­les como para analizar y procesar datos cie­n­tí­fi­cos y eco­nó­mi­cos. Si los procesos complejos superan la potencia de cálculo de un ordenador o de un clúster in­fo­r­má­ti­co local, el Grid Computing puede ayudar a integrar, evaluar o vi­sua­li­zar grandes ca­n­ti­da­des de datos. Para el Grid Computing no hace falta hardware especial. De hecho, el mi­d­d­le­wa­re (software para el in­te­r­ca­m­bio de datos entre apli­ca­cio­nes) de los or­de­na­do­res acoplados garantiza la di­s­po­ni­bi­li­dad de ca­pa­ci­da­des in­fo­r­má­ti­cas libres dentro de la or­ga­ni­za­ción virtual.

Ámbitos de uso del Grid Computing

El Grid Computing no está limitado a ningún ámbito de apli­ca­ción es­pe­cí­fi­co, ya que conectar clústeres de or­de­na­do­res puede tener distintas fi­na­li­da­des. Típicas áreas de uso de los su­pe­ro­r­de­na­do­res virtuales son los análisis cie­n­tí­fi­cos y eco­nó­mi­cos de Big Data con los que se pueden procesar grandes ca­n­ti­da­des de datos y hacer si­mu­la­cio­nes de alta in­te­n­si­dad de cálculo. Se aplican a la in­ve­s­ti­ga­ción en ciencias naturales y medicina, pero también en me­teo­ro­lo­gía, industria o física de pa­r­tí­cu­las. Un ejemplo son los ex­pe­ri­me­n­tos a gran escala del Gran Co­li­sio­na­dor de Hadrones del CERN.

Visión de conjunto de las cla­si­fi­ca­cio­nes de Grid Computing

Para definir y cla­si­fi­car Grid Computing y di­s­ti­n­gui­r­la de otras te­c­no­lo­gías como el Cluster Computing o Peer‑to‑Peer Computing, existen tres pilares ese­n­cia­les:

  • Coor­di­na­ción de­s­ce­n­tra­li­za­da tanto local como global de recursos como clústeres de or­de­na­do­res, análisis de datos, memorias de gran capacidad y bases de datos
  • In­te­r­fa­ces (nodos) abiertas y mi­d­d­le­wa­re (pro­to­co­los o conjunto de pro­to­co­los) es­ta­n­da­ri­za­dos que unen las unidades in­fo­r­má­ti­cas con la red principal y di­s­tri­bu­yen las tareas
  • Apro­vi­sio­na­mie­n­to de una calidad de servicio no trivial para di­s­tri­buir de manera óptima el flujo de datos y ga­ra­n­ti­zar la es­ca­la­bi­li­dad constante y tra­n­s­mi­sión de datos fiable bajo altas demandas in­fo­r­má­ti­cos

Aparte de esto, podemos cla­si­fi­car el Grid Computing en distintos subgrupos:

  • Computing Grids (redes de co­mpu­tación): la forma más utilizada de Grid Computing, en la que los usuarios de la red apro­ve­chan la potencia acoplada de un su­pe­ro­r­de­na­dor virtual a través de un proveedor red para di­s­tri­buir o escalar procesos de co­mpu­tación altamente in­te­n­si­vos.
  • Data Grids (redes de datos): las redes de datos ofrecen las ca­pa­ci­da­des in­fo­r­má­ti­cas de los or­de­na­do­res co­ne­c­ta­dos para evaluar, re­pre­se­n­tar, tra­n­s­fe­rir, compartir o analizar grandes ca­n­ti­da­des de datos mediante los nodos de la red.
  • Knowledge Grids: esta es­tru­c­tu­ra utiliza las ca­pa­ci­da­des de su­pe­ro­r­de­na­dor de la red para escanear, conectar, recoger, evaluar o es­tru­c­tu­rar grandes conjuntos de datos o bases de datos de co­no­ci­mie­n­to.
  • Ressource Grids: estos sistemas definen las je­ra­r­quías acopladas de los pro­vee­do­res de la red, sus usuarios y los pro­vee­do­res de recursos. En este caso, un modelo de roles determina qué pro­vee­do­res de recursos pueden pro­po­r­cio­nar ca­pa­ci­da­des de al­ma­ce­na­mie­n­to y cálculo, conjuntos de datos, software y hardware, apli­ca­cio­nes, sensores, di­s­po­si­ti­vos de medición y otros in­s­tru­me­n­tos mediante las in­te­r­fa­ces.
  • Service Grids: en los Service Grids, los pro­vee­do­res de servicios de red pro­po­r­cio­nan a los usuarios de la red los co­m­po­ne­n­tes acoplados y ca­pa­ci­da­des de pro­vee­do­res de recursos como servicio completo. Así, el Grid Computing combina la orie­n­ta­ción de servicios y los servicios in­fo­r­má­ti­cos.

¿Qué di­fe­re­n­cia hay entre Grid Computing y Cloud Computing?

No debemos confundir Grid Computing con Cloud Computing. En el Grid Computing, se conectan múltiples recursos acoplando de manera de­s­ce­n­tra­li­za­da los or­de­na­do­res, creando así un su­pe­ro­r­de­na­dor virtual. En este caso, los pro­vee­do­res de la red son los pro­pie­ta­rios de las in­frae­s­tru­c­tu­ras de or­de­na­do­res y apli­ca­cio­nes en red. En el Cloud Computing, en cambio, los pro­vee­do­res de la nube ofrecen servicios in­fo­r­má­ti­cos, ca­pa­ci­da­des de al­ma­ce­na­mie­n­to y servicios globales mediante el alo­ja­mie­n­to en la nube, pero organizan la co­mpu­tación de manera ce­n­tra­li­za­da en la nube.

Las ventajas del Cloud Computing son, entre otras, las in­frae­s­tru­c­tu­ras in­fo­r­má­ti­cas ex­te­r­na­li­za­das y es­ca­la­bles, las ca­pa­ci­da­des del al­ma­ce­na­mie­n­to en la nube y un menor esfuerzo in­fo­r­má­ti­co. Tanto empresas como usuarios pa­r­ti­cu­la­res pueden usar los servicios en la nube para distintas tareas de manera ce­n­tra­li­za­da y a buen precio, sin tener que disponer de recursos propios. El Grid Computing, en cambio, presenta la ventaja de que puede procesar, ejecutar y acceder a enormes ca­n­ti­da­des de datos y complejos procesos de manera económica mediante ca­pa­ci­da­des acopladas a la red sin tener centros de datos físicos propios.

Grid Computing: pros y contras

Pros

  • Coor­di­na­ción y gestión de procesos y tareas entre di­s­po­si­ti­vos
  • Escalado económico de los procesos de la empresa mediante potencia de cálculo y ca­pa­ci­da­des de al­ma­ce­na­mie­n­to acopladas
  • Pro­ce­sa­mie­n­to si­mu­l­tá­neo/paralelo, análisis y pre­se­n­ta­ción de grandes ca­n­ti­da­des de datos a través de redes in­fo­r­má­ti­cas globales
  • Las tareas complejas pueden re­so­l­ve­r­se con mayor rapidez y eficacia
  • Uti­li­za­ción fiable y uso óptimo de la in­frae­s­tru­c­tu­ra in­fo­r­má­ti­ca mediante or­ga­ni­za­cio­nes virtuales y di­s­tri­bu­ción flexible de tareas
  • Baja su­s­ce­p­ti­bi­li­dad a los fallos, ya que las ca­pa­ci­da­des se di­s­tri­bu­yen de forma flexible y modulan en la red
  • No hace falta una gran inversión en in­frae­s­tru­c­tu­ra de se­r­vi­do­res

Contras

  • En algunos casos, ad­mi­ni­s­tra­ción compleja y co­m­po­ne­n­tes de sistema in­co­m­pa­ti­bles
  • La potencia de cálculo no aumenta li­nea­l­me­n­te con el número de or­de­na­do­res acoplados
Ir al menú principal