Este es un elemento estructural por Google en el cual se utilizan mapeos y trabajos que reducen. En eso se basa su modelo de programación.
Manejan una cantidad cercana a 20 Petabytes en sus servidores.
Cuando se "mapea" esto lo que hace es buscar la información en formas pares de valores, y los que "reducen" sólo las unen, simplifican y procesan dichos datos.
MapReduce se encarga de paralelizar tareas, controlar trabajos, mejorar la comunicación que existe entre ellos, y controlar los errores que se lleguen a producir.
Algunas de las utilidades que le dan a MapReduce son:
- Traducción estadística
- Proceso de imágenes de satélite
- Aprendizaje automático
- Análisis de páginas
MapReduce toma el trabajo de cerca de unos 130,000 PCs convencionales. MapReduce está muy enfocado a problemas de escalabilidad, ya que no olvidemos que Google se expande muchísimo a cada segundo que pasa, desde gente que se une al servicio de mail, como para muchas otras cosas.
Fuentes: http://www.lacofa.es/index.php/tecnologias/mapreduce-paralelismo-en-google
MapReduce al ser un algoritmo de BigData aplicado a data mining o patrones estadísticos, esta siendo utilizado para parsear grandes logs de servers de todo tipo y luego estimar mediante metodos multivariable sobre acciones a tomar, fijense en distros como cloudera o hortonworks las cuales se basan en hadoop cluster y diversos algoritmos de datamining
ResponderEliminarMapReduce al ser un algoritmo de BigData aplicado a data mining o patrones estadísticos, esta siendo utilizado para parsear grandes logs de servers de todo tipo y luego estimar mediante metodos multivariable sobre acciones a tomar, fijense en distros como cloudera o hortonworks las cuales se basan en hadoop cluster y diversos algoritmos de datamining
ResponderEliminar