apache spark « Best Recipes Ever

diciembre 8, 2016

Mis proyectos favoritos para el 2017

Filed under: Open Sistemas,Proyectos,scala,spark — Etiquetas: apache beam, apache spark, google cloud dataflow, kappa architecture, scala, scio — admin @ 7:46 pm

arquitectura kappa y prácticamente todos los proyectos en los que he estado implicado, se han desarrollado usando esta arquitectura. [caption id="attachment_2887" align="alignleft" width="150"] Apache Beam[/caption] Desde hace un tiempo he empezado a estudiar y usar Apache Beam. El punto de inflexión ha sido las charlas que vi durante la apachecon big data europe que se celebró en Sevilla y en la que di una charla sobre arquitectura kappa. La conversación que tuve con Sergio Fernandez (@wikier) fue decisiva. Cuando un crack como Sergio te cuenta como está trabajando con Apache Beam y por es una tecnología es killer es muy difícil no investigar más 😉 En resumen, Apache Beam es un framework para crear arquitecturas que trabajen con datos muy al estilo de la arquitectura kappa. Si hubiera que definir una sola característica por la que es interesante sería la capacidad de abstracción en la definición de la arquitectura con un DAG que se puede ejecutar contra distintos frameworks: Apache Spark, Storm, Flink, Google Dataflow o con un Local Runner en tu máquina. Ahora mismo está en el incubator de la fundación apache y debe estar a punto de ser aprobado para que se convierta en un proyecto oficial. Ya hay empresas usándolo en producción y las pruebas que he hecho no me han dado ningún problema. También hay una mala y una buena noticia. La mala es que apache beam esta escrito en java y se programa en java. No soy un fan de java y menos de como resuelven las API/SDKs. La buena noticia es que la gente de spotify que usa a tope Apache Beam se ha programado un binding para scala. Además son unos cracks y se nota en lo bien que han resuelto el binding. Han conseguido DSL funcional, bello y casi un clon de spark/cascading. Vamos que no pienso usar java y si scala con el proyecto Scio que es como se llama el proyecto de spotify. Que por cierto tiene licencia apache y está en proceso de merging con Apache Beam. No son los únicos dos proyectos que incluyo para el 2017, ya os contaré más en otros posts 😉 ]]>

Comments (0)

febrero 1, 2016

Artículo: Is Spark replacing Hadoop?

Filed under: ASPgems,big data,spark — Etiquetas: apache spark, hadoop, spark — admin @ 7:11 am

http://flip.it/0JzFG]]>

Comments (0)

septiembre 22, 2015

En ASPGems hemos preparado un curso de Apache Spark con NeuroK

Filed under: ASPgems,big data,scala,spark — Etiquetas: apache spark, aspgems, big data, neurodidactica, NeuroK — admin @ 11:53 am

NeuroK y la Neurodidactica NeuroK: una nueva manera de aprender. Aquí está la información del curso Descubre Apache Spark]]>

Comments (0)

agosto 11, 2015

Me ha entrevistado Soraya Paniagua

Filed under: big data,Proyectos,scala,spark — Etiquetas: apache spark, big data, soraya paniagua, spark — admin @ 12:25 pm

Mi último post es una entrevista a @juantomas : Spark es una de las tecnologías más bellas de los últimos 30 años Ⓢ http://t.co/ihxQpjRgSc

— Soraya Paniagua (@sorayapa) August 11, 2015 ]]>

Comments (3)

febrero 25, 2015

Hacer proyectos con Spark y Scala tiene premio

Filed under: ASPgems,big data,Proyectos,scala,spark — Etiquetas: apache spark, aspems, big data, cassandra, cassandradb, databricks, kafka, mss, saqqara, scala, spark cluster, telefonica — admin @ 2:57 pm

proyecto Apache Spark. Mucho de lo que allí contaron no era más que la primera información de un Spark que se había «graduado» en noviembre del 2013. También recuerdo perfectamente el comentario final del ponente: «Spark va a ser la bomba» Aquella frase se me quedó marcada a fuego y confirmaba que no era el único que veía clara la oportunidad y posibilidades de Spark. Ahora un año después AUTELSI ha premiado la innovación del proyecto de Telefónica MSS-Saqqara y una parte importante del funcionamiento y prestaciones del producto se lo debemos a Spark. Para ser justos la combinación Spark y el lenguaje Scala es definitivamente ganadora e innovadora. Todas las virtudes de Scala han sido fundamentales para poder influir y concebir Spark y me voy a permitir una pequeña licencia: «Nunca se hubiera podido crear algo como Spark con Java». La otra parte con la que me siento premiado, realmente premiado, es con el equipo que son los que realmente han conseguido que lo difícil pareciera fácil, los que desde el principio estuvieron dispuestos a salir de su zona de confort para apostar por una tecnología que al final no solo funciona perfectamente si no que además tiene premio. ]]>

Comments (0)

diciembre 19, 2014

Zeppelin: Scala Spark Notebook

Filed under: ASPgems,big data,Hacks,scala,spark — Etiquetas: apache spark, aspgems, notebook, scala, spark, zeppelin — admin @ 12:52 pm

zeppelin que integra scala, spark y markdown. Como un video vale más que mil palabras, este el primer video de la beta de zeppelin. ]]>

Comments (0)

Best Recipes Ever Just another WordPress site

diciembre 8, 2016

Mis proyectos favoritos para el 2017

febrero 1, 2016

Artículo: Is Spark replacing Hadoop?

septiembre 22, 2015

En ASPGems hemos preparado un curso de Apache Spark con NeuroK

agosto 11, 2015

Me ha entrevistado Soraya Paniagua

febrero 25, 2015

Hacer proyectos con Spark y Scala tiene premio

diciembre 19, 2014

Zeppelin: Scala Spark Notebook