juantomas Hacking the planet

12 diciembre, 2016

Andrew Ng esta escribiendo un nuevo libro: Machine Learning Yearning

Andrew Ng está escribiendo un nuevo libro sobre Machine Learning: «Machine Learning Yearning».

Como forma de promoción y corrección de errores, ha propuesto que cada vez que termine un capítulo envía un draft del libro a los que estén suscritos.

El contenido del libro tiene muy buena pinta y promete que se convierta en una buena introducción de como se tiene que abordar un proyecto de machine learning.

Esta es la página de «Machine Learning Yearning«.

 

10 diciembre, 2016

SCIO: como instalar la consola en Mac OSX

Filed under: big data,google bigquery,Open Sistemas,Proyectos — Etiquetas: , , — juantomas @ 8:00 am

Si hay una herramienta que ha mejorado mi productividad en los últimos 10 años han sido las consolas interactivas (REPL). La primera vez que use esta tecnología y le saqué mucho provecho qué cuando empecé a desarrollar sitios webs con ruby on rails.

La consola me vino genial no solo en mejorar mi curva de aprendizaje, si no con el desarrollo día a día.

La gente de spotify ha creado una consola REPL para poder usar interactivamente Scio y desarrollar más rápidamente proyectos que usen apache beam.

Las instrucciones para instalar la REPL en tu mac son muy sencillas si usas homebrew:

brew tap spotify/public
brew install scio
scio-repl

La primera linea instala el tap de spotify con las herramientas para mac/homebrew la gente de spotify y con la segunda se instala la versión compilada de scio REPL.

Podéis encontrar algunos ejemplos de uso de Scio/REPL en la página de GitHub del proyecto Scio.

 

 

7 noviembre, 2016

Ya está anunciado el siguiente meetup de machine learning spain

Filed under: big data,Eventos,Machine Learning,Open Sistemas,spark — Etiquetas: , , , — juantomas @ 11:57 am

Machine Learning Spain XV

Auditorio Google Campus Madrid
Calle de Manzanares, 1, Madrid (edit map)

¡Hola! Ya tenemos fecha para el siguiente meetup, será el día 14 de noviembre (lunes) a las 18:30h en Campus Madrid. Esa semana habrá bastantes eventos relacionados con los datos en Madrid y Barcelona, esperamos que sean muy útiles.

La agenda será variada y completa.

18:30 – Acceso al auditorio. Calle de Manzanares, 1.

18:35 – «Programación Paralela en Big Data: Una aplicación sobre Series Temporales».

Con la generación de más cantidad de datos cada día se hace necesaria la programación de los algoritmos de una forma paralelizable para reducir el tiempo de proceso de los mismos. Así, la presentación incluirá la base de cómo paralelizar sobre distintas plataformas y librerías como Spark y Dask.

Ponente:
Juan Luis Rivero. Profesional de la consultoría, desarrollo e integración de soluciones con más de 25 años de experiencia en multinacionales. Ha dedicado parte de su carrera al diseño e implantación de algoritmos y analítica de datos en el sector de Telecom.

19:15 – «Aprendizaje de comportamientos».

Uno de los principales problemas de las aplicaciones modernas es conocer de forma precisa cómo usan los usuarios nuestra aplicación. Es decir, saber a que horas se utilizan unas funcionalidades o incluso conocer cómo un usuario ha sido capaz de llegar a una de nuestras nuevas funcionalidades. En esta charla describiremos una posible manera de obtener las políticas de comportamiento de nuestros usuarios y conocer cómo se mueven por nuestra aplicación. Describiremos cómo podemos obtener esta información (Colas de mensajes), almacenarla y utilizarla con el fin de intentar aprender o definir comportamientos comunes entre nuestros usuarios. Esta información puede servir para mejorar nuestra aplicación, su funcionalidad o para construir sistemas automáticos que realicen ciertas tareas por ellos.
Ponente:
Moisés Martínez. PhD en Inteligencia Artificial por la Universidad Carlos III de Madrid (especializado en Planificación automática, Aprendizaje automático y Sistemas de control). Investigador, mentor, orgulloso organizador de T3chFest y amante de la tecnología. Actualmente trabaja como Lead Data Scientist en beBee – affinity networking.

20:00 – «Convirtiendo Machine Learning en Negocio (Desde el BigData hasta la generación de servicios en el Real Estate)».

El sector inmobiliario está a punto de sufrir un cambio disruptivo derivado del nuevo contexto económico, social y tecnológico que otros sectores ya han sufrido. En esta sesión se realizará un recorrido por la aplicación del Machine Learning a este sector y su aporte en los diferentes fragmentos de la cadena de valor del mismo.
Ponente:
Carlos Olmos de Frutos.Es fundador y director de uDA. Ha desarrollado su carrera en el sector del Real Estate donde ha planificado y liderado proyectos de desarrollo e inversión de hasta 14M €. Desde el 2011 lidera diversos proyectos que integran las Smart Cities y el BigData en soluciones de inversión inmobiliaria, integrando equipos multidisciplanares para la creación de productos y servicios con modelos de negocio asociados viables desde las primeras fases. Es arquitecto urbanista por la UPM y por la universidad Paris Val-de-Marne.

20:45 – ¡Cervezas y networking!

Tomaremos unas cervezas y podremos seguir charlando sobre los temas de interés que salgan en esta jornada.

Nos vemos pronto, el 14 de noviembre en Campus Madrid.

1 febrero, 2016

Artículo: Is Spark replacing Hadoop?

Filed under: ASPgems,big data,spark — Etiquetas: , , — juantomas @ 7:11 am

La respuesta corta: SI

http://flip.it/0JzFG

9 noviembre, 2015

Yann LeCun: primeros vídeos de convolutionals neural networks en 1993!

Filed under: ASPgems,big data,procrastination — Etiquetas: , , — juantomas @ 11:01 am

Que grande Yann Lecun!!!

y si te quedas con ganas de más, esta es una buena introducción la redes neuronales convolucionales.

22 septiembre, 2015

En ASPGems hemos preparado un curso de Apache Spark con NeuroK

Filed under: ASPgems,big data,scala,spark — Etiquetas: , , , , — juantomas @ 11:53 am

Empezará el día 1 de octubre es un curso online y usaremos la herramienta de neurodidactica que hemos desarrollado Neurok.

El objetivo del curso es descubrir y entender que es Spark y como sacarle el máximo partido.

La idea es abordar el curso de forma distinta a los cursos tradicionales online y que estamos convencidos que va a revolucionar el mundo de la educación.

Os recomiendo que le echéis un vistazo a estos dos post donde explicamos que es NeuroK:

NeuroK y la Neurodidactica

NeuroK: una nueva manera de aprender.

Aquí está la información del curso Descubre Apache Spark

13 agosto, 2015

Nueva sección con Videos, Entrevistas y presentaciones

Filed under: big data,Personal,procrastination,videos recomendados — juantomas @ 1:40 pm

He creado una nueva sección con vídeos, entrevistas y presentaciones.

La idea es recopilarlas y de paso poder revisarlas de vez en cuando por que hay que ver como pasa el tiempo!!!

No están todos los vídeos pero si tienes por ahí localizado alguno y no están en la lista, sería genial si me mandas un enlace a juantomas (.) garcia (@) gmail (.) com

11 agosto, 2015

Me ha entrevistado Soraya Paniagua

Filed under: big data,Proyectos,scala,spark — Etiquetas: , , , — juantomas @ 12:25 pm

y la verdad que ha quedado genial!!!

 

8 abril, 2015

Hoy toca la V edición del MeetUp de Machine Learning

Filed under: ASPgems,big data,Eventos,scala,spark — Etiquetas: , , , — juantomas @ 11:27 am

En esta edición contaremos con José Manuel Navarro Gonzalez, es Ingeniero de Telecomunicación por la Universidad Miguel Hernández de Elche y, actualmente, doctorando en el Departamento de Ingeniería de Sistemas Telemáticos de la Universidad Politécnica de Madrid e investigador en el Center for Open Middleware, un centro tecnológico mixto entre el Banco Santander, Produban, Isban y la Universidad Politécnica de Madrid.

Su campo de investigación es la mejora de la gestión de sistemas distribuidos mediante la aplicación de Machine Learning. Ha participado en diversos proyectos de investigación, desde la compresión de imagen a la bioingeniería, siempre desde la perspectiva del Machine Learning aplicado. Usa en su día a día y sus intereses de investigación son una confluencia entre el Internet of Things y el Machine Learning que permitan la interconexión de todo lo que nos rodea y los beneficios que se pueden extraer de analizar los datos generados por ello.

El comunicado y oficial y los enlaces a la inscripción están en nuestra sección de big data de aspgems.

 

14 marzo, 2015

Scalatra para impacientes: Como montar un proxy de Elastic Search en 3 minutos

Un proxy puede ser un buen ejemplo de microservicio para construir con Scalatra. Un proxy es un servicio que normalmente recoge peticiones y las traslada a otro servicio. Si hay respuesta de este servicio se la devuelve al que empezó la llamada.

Habitualmente además se añaden algunas cosas que el servicio original no implementa como pueden ser: validación de usuarios, estadísticas de uso, agregación de información, simplificación de interfaces, tareas de servicio, capa de administración, etc.

En nuestro caso vamos a implementar un proxy contra Elastic Search con Scalatra en menos de 3 minutos ;-P

Eso si con algunos requisitos:

* Deberías tener instalado Scala. Si no lo tienes aquí tienes un mini tutorial de como instalar scala estilo shotgun.

* Si ya tienes instalado Scalatra todavía lo haremos en menos tiempo. Si no este manual de como instalar Scalatra para impacientes   te ayudará a hacerlo en un par de minutos.

Y ahora llega la mejor parte, tenemos dos opciones:

a) hacerlo de cero. Buscar toda la documentación de Scalatra, Interface REST de Elastic Search, etc, etc.

b) Clonar este proyecto de github, configurarlo y aprender como con unas cuantas lineas de Scalatra montamos un proxy de Elastic Search y los configuramos a nuestra medida y necesidades.

Por supuesto vamos a escoger la opción B que nos mete en el partido en 3 minutos.

1) clonar el proyecto de ejemplo de proxy para Elastic Search usando Scalatra:

git clone https://github.com/nfb-onf/nfbsearch-scalatra.git

2) Configurar el URI de conexión a tu Servidor de elastic Search (linea 35)

$ cd NFBSearch-Scalatra
$ vi src/main/scala/ca/nfb/NFBSearchServlet.scala

3) hacer un build del proyecto y lanzarlo.
$ ./sbt
> container:start
> browse

Lo que más me gusta de usar Scalatra es lo sencillo que es implementar una acción:

  get("/search") {                                                     
    contentType = formats("json")                                      
    val q:String = params("q")                                         
    val httpClient = new HttpClient                                    
    val response: Response = httpClient.get(new URL("http://localhost:9200/nfb_films/films/_search?q=" + q))          
    response.body.asString                                             
  }                     

Incluso alguien con poca experiencia con Scala/Scalatra sería capaz de leer y modificar este código.

Es puro código suscinto sin ningún tipo de ceremonia, lo explica muy bien Javier Lafora, nuestro CTO en ASPGems en su post sobre por que usamos ruby y rails en ASPGems como tecnología web y tiene muchos puntos en común con «Por que usamos Scala para hacer Big Data en ASPGems» (este todavía no está escrito!!! 😉 )

«Scala is Love»

Agradecer a los usuarios de la cuenta de github «nfb-onf» que me ha ahorrado un par de horas del plan A con su maravillosa y gratuita contribución a la comunidad. Muchas Gracias!!! os debo unas cervezas!!

« Newer PostsOlder Posts »

Powered by WordPress