martes, 22 de noviembre de 2011

MapReduce

Este es un elemento estructural por Google en el cual se utilizan mapeos y trabajos que reducen. En eso se basa su modelo de programación.



Manejan una cantidad cercana a 20 Petabytes en sus servidores.

Cuando se "mapea" esto lo que hace es buscar la información en formas pares de valores, y los que "reducen" sólo las unen, simplifican y procesan dichos datos.

MapReduce se encarga de paralelizar tareas, controlar trabajos, mejorar la comunicación que existe entre ellos, y controlar los errores que se lleguen a producir.

Algunas de las utilidades que le dan a MapReduce son:

- Traducción estadística
- Proceso de imágenes de satélite
- Aprendizaje automático
- Análisis de páginas

MapReduce toma el trabajo de cerca de unos 130,000 PCs convencionales. MapReduce está muy enfocado a problemas de escalabilidad, ya que no olvidemos que Google se expande muchísimo a cada segundo que pasa, desde gente que se une al servicio de mail, como para muchas otras cosas.

Fuentes: http://www.lacofa.es/index.php/tecnologias/mapreduce-paralelismo-en-google

2 comentarios:

  1. MapReduce al ser un algoritmo de BigData aplicado a data mining o patrones estadísticos, esta siendo utilizado para parsear grandes logs de servers de todo tipo y luego estimar mediante metodos multivariable sobre acciones a tomar, fijense en distros como cloudera o hortonworks las cuales se basan en hadoop cluster y diversos algoritmos de datamining

    ResponderEliminar
  2. MapReduce al ser un algoritmo de BigData aplicado a data mining o patrones estadísticos, esta siendo utilizado para parsear grandes logs de servers de todo tipo y luego estimar mediante metodos multivariable sobre acciones a tomar, fijense en distros como cloudera o hortonworks las cuales se basan en hadoop cluster y diversos algoritmos de datamining

    ResponderEliminar