Zeppelin: Scala Spark Notebook

Ya sabéis que no tengo la menor duda que Spark y Scala son mis tecnologías favoritas para el 2015.

Si además sumamos que tanto Scala como Spark tienen shell, el siguiente paso lógico era que tuvieran una herramienta notebook del estilo del python notebook.

Entre las distintas opciones que están apareciendo la que más me ha gustado es zeppelin que integra scala, spark y markdown.

Como un video vale más que mil palabras, este el primer video de la beta de zeppelin.

Social Share Counters

Comments

Primeros testimonios de la victimas del Big Data

¿Conoces más casos?

Social Share Counters

Comments

Charla Big Data con Spark

Mañana jueves 11 de diciembre, doy una charla sobre Apache Spark en los DevOSS Azure Days.

Mañana haré una introducción de spark y un par demos en tiempo real.

Hay algunas cosas de Spark que le han convertido en el proyecto con más visibilidad en el mundo del big data:

* Esta escrito en Scala. Aviso: Scala se va a convertir en el lenguaje con más proyección en el mundo big data. Tiene lo mejor del mundo de la programación orientada a objetos y los lenguajes funcionales.

* El enfoque “in memory” para tratar los datasets le da una ventaja de hasta 100 veces más rápido que hadoop.

* Requiere mucho menos código e incrementa la riqueza y potencia de las operaciones/transforamaciones que se pueden realizar con la información.

Si os queréis apuntar al evento todavía estáis a tiempo. Este es el enlace  para registrarse.

 

 

Social Share Counters

Comments

Meetup Introducción al Machine Learning

Los organizadores del meetup MAD Open Tech me han invitado a dar una charla sobre Machine Learning en el meetup sobre Big Data para analítica predictiva en la nube con Machine Learning.

La idea hacer una introducción de que es Machine Learning y como sacarle partido en 40 minutos. El tiempo va a ser un reto importante y espero poder desarrollar una charla que empiece con los conceptos más básicos y tenga bastantes ejemplos prácticos.

Después de  mi charla la gente de MS Azure contará como usar ML Azure que es la plataforma de Machine Learning de MS.

Este es el enlace para apuntarte a la charla de Machine Learning en el MAD Open Tech.

 

Social Share Counters

Comments

II Meetup Machine Learning Spain

El segundo meetup tendrá lugar el día 22 de octubre enMedialab Prado a partir de las 18h de la tarde (ponencia a las 19h). Esta vez el meetup se enmarca en el entorno de una jornada sobre Tecnologías Abiertas que llevará a cabo el Ministerio de Industria junto con CENATIC. Habrá ponencias desde las 10 de la mañana hasta las 20.30h.

La ponencia en esta ocasión versará sobre la herramienta de Machine Learning de Azure. Nos permite integrar todo el proceso de tratamiento y análisis de datos en un mismo entorno y además con la potencia de sus servidores para procesamiento y almacenamiento.

La programación del II meetup Machine Learning Spain será la siguiente:

18.00 Networking con machine learners y el resto de asistentes a la jornada.

19.00 Análisis predictivo en la nube a través de ejemplos con Azure Machine Learning. Jorge Ramón Muñoz, Enterprise Services Consultant en Microsoft y José Ángel Fernández, Technical Evangelist en Microsoft. 

20.00 Más networking tomando unas cervezas.

Para el meetup tenéis que confirmar asistencia aquí, en nuestro grupo. Y si queréis asistir a las jornadas desde la mañana, además debéis registraros en este enlace. Ahí podréis ver el programa completo previsto. Os animo a participar durante todo el día, y por supuesto no os podéis perder el meetup.

Social Share Counters

Comments

Posts y eventos de big data

Esta semana hemos tenido bastantes noticias y anuncios:

* La primera viene del mundo de la visualización de información: New Relic ha comprado dusksboard. Felicidades a mi amigo Diego Mariño que se convierte en un serial y abandona el grupo de los que “una vez les tocó la lotería y desde entonces siguen hablando de ello”.

 

* Fernando Calle ha escrito un par de posts sobre machine learning absolutamente recomendables:

Google sabe dónde y cuándo (representado con R)

 

Machine Learning con R y Azure ML

* Después del éxito del primer meetup de machine learning Spain, ya tenemos programado la segunda edición. Será acerca del entorno de machine learning que ha creado microsoft para azure y que tiene muy buena pinta. En esta ocasión contamos con bastantes más plazas para asistentes!!! Para los que no pudisteis asistir al primero y gracias a Andrés Leonardo de Google aquí tenéis los videos:  


Social Share Counters

Comments

Hoy Databeer a las 19:00 en el Impact Hub de Madrid

Más información en la página de Data Beers Madrid.

 

 

Social Share Counters

Comments

Nuevo meetup de machine learning y nuevos proyectos

Con las pilas recargadas después de unas pequeñas vacaciones, volvemos a tope con un montón de proyectos.

El primero ha sido la creación de un meetup que echábamos en falta y con el que queríamos aportar nuestro granito de arena. Entre Fernando Calle y un servidor estamos coordinando un meetup de machine learning que empieza en Madrid, pero el objetivo es moverlo por más ciudades.  En unos días programaremos la primera charla, así que lo mejor es que os apunteis al meetup para que os podamos avisar.

Scala está haciéndose un sitio a toda velocidad entre mi colección de lenguajes favoritos y me apetece mucho contaros algunas cosas como: como instalarlo, mis experiencias, algún miniproyecto que quiero hacer con scala (el  primero es probable que sea un wrapper acceder a bigquery), como pensar en scala si antes pensabas en ruby, cosas de este estilo.

Seguramente las publicaré entre este blog y la sección de big data del blog de aspgems. De hecho os recomiendo que le déis un vistazo a los posts que estamos escribiendo sobre big data en aspgems. Allí podréis encontrar desde técnicas de R avanzadas, google query,  artículos de machine learning pasando por algunos de los eventos que organizamos en aspgems.

 

 

 

 

Social Share Counters

Comments (4)

MESA otro de los papers de google que van a revolucionar el big data

Hace unos días el grupo de google cloud ha publicado este paper sobre MESA. Google vuelve a hacer público sus avances en bases de datos distribuidas y de altas prestaciones. Hay que reconocer que la capacidad de innovación de Google es impresionante.

Aunque supongo que no van a liberar la tecnología, de hecho intentar implementarla solo está al alcance de unos pocos, tradicionalmente este tipo de papers genera un aluvión de soluciones libres que implementan e incluso mejoran las tecnologías descritas.

Una lectura muy recomendable para estos días de verano.

 

Social Share Counters

Comments

El grupo de big data de aspgems sigue creciendo

Cada vez somos más haciendo Big Data en ASPGems.

Si cumples algo de esto:

  • te apetece exprimir lo que sabes de machine learning
  • apache spark está en tu punto de mira
  • scala te mola
  • si el elefante no tiene secretos para ti pero necesitas más retos
  • estrujas datos en batch o streaming con la misma alegría
  • escojes la mejor solución MPP (cassandra, mongodb o BigQuery)
  • te apetece trabajar en un “entorno de trabajo ala Joel Spolky” menos las sillas Aeron ;-)

 

Envianos un correo a juantomas ( arroba ) aspgems (punto) com y seguro que te hacemos un hueco en el equipo.

PD: de vez en cuando vamos escribiendo algunos posts sobre big data que te pueden interesar.

Social Share Counters

Comments

« Previous entries