lunes, 11 de julio de 2011

HADOOP (Sistemas Distribuidos) **Puntos Extras**


Arquitectura.

Jobtracker (rastreador de trabajo): Nodo maestro.
Tasktracker (rastreador de tareas).
Namenode (nodo de nombres).
Datanode (nodo de datos).
Compute node (nodo de cómputo): Consiste en un nodo de datos y un rastreador de tareas.

El Hadoop Distributed File System (HDFS) es un sistema de Arhivos distribuido, ecalable y portatilescrito en Java para el framework Hadoop. Contiene un único nodo de datos; un clúster de datos forma el clúster HDFS. Los nodos se pueden hablar para mover copias, reequilibrar datos y conservar la replicación de los mismos.

Para reducir tráfico, se necesitan saber qué servidores están más cerca a los archivos, con esto se proporcionan puentes específicos del sistema.

Tambien se utiliza el motor MapReduce que consiste en un Job Tracker a dicho motor las aplicaciones le envían trabajos MapReduce. Job Tracker impulsa fuera a los nodos Task Tracker disponibles en el cluster tratando de mantenerse cerca en el trabajo. Si no se puede mantener el trabajo en el mismo nodo el trabajo se le dan la prioridad a los nodos en el mismo rack. El rastreador de Trabajo dá el trabajo para el seguidor que se encuentre más cerca a los datos con una ranura que esté disponible.

Referencias
http://es.wikipedia.org/wiki/Hadoop
http://mistock.lcompras.biz/tallersoftware/1120-trabajo-4-hadoop

No hay comentarios:

Publicar un comentario