Red de información TI para profesionales ITMedia NetWork

jueves, 28 de marzo de 2024
Actualizado a las 21:41


Búsqueda avanzada

Publicidad

Publicidad

Últimas noticias

KDD Cup 2017: Innova-tsn primera compañía europea en la copa del mundo de Data Mining

04 Julio 2017por Redacción

Innova-tsn y su proyecto para mejorar flujos de tráfico en autopistas ha logrado el primer puesto en la región de EMEA, y el séptimo a nivel mundial, en la Knowledge Discovery and Data Mining-KDD Cup 2017, la copa del mundo de analytics que ha organizado Alibaba Cloud.

El caso propuesto por Alibaba Cloud para la KDD Cup 2017 estaba relacionado con la predicción de flujos de tráfico en las autopistas chinas

El caso propuesto por Alibaba Cloud para la KDD Cup 2017 estaba relacionado con la predicción de flujos de tráfico en las autopistas chinas

El caso propuesto por Alibaba Cloud, como organizador de la KDD Cup 2017, estaba directamente relacionado con la predicción de los flujos de tráfico de las autopistas de peaje en China y el objetivo final era ofrecer a los responsables de la gestión del tráfico medidas preventivas basadas en datos y preparar el camino hacia una solución holística y realista a los cuellos de botella del tráfico.

Según Innova-tsn, una de las características de la KDD Cup que la hace diferente de otras competiciones es que los problemas propuestos suelen ser abiertos y para abordarlos no existe un enfoque obvio y conlleva un extra de creatividad

Para el desarrollo de la solución del ejercicio planteado, Innova-tsn conformó un equipo de especialistas que han trabajado en diferentes líneas de modelización, creando nuevas variables y probando distintas técnicas para predecir el tiempo medio empleado en recorrer un tramo de carretera y el volumen de vehículos que pasaba por distintos puntos de peaje.

En esta edición de la KDD Cup, Innova-tsn compitió con 3.547 grupos de analistas e ingenieros de muy diferentes países.
El primer paso del equipo de Innova-tsn que participó fue realizar un análisis del problema planteado y las posibles estrategias para abordarlo.

En una segunda fase, se llevó a cabo el tratamiento de los datos originales para estructurar la información y creación de variables que pudieran tener un impacto positivo en la predicción del modelo. A partir de este punto, se realizó el desarrollo de los modelos y el ensamblaje de las distintas estrategias en una sola.

Innovación y creatividad

Según Innova-tsn, una de las características de la KDD Cup que la hace diferente de otras competiciones es que los problemas propuestos suelen ser abiertos y para abordarlos no existe un enfoque obvio. Esto conlleva un extra de creatividad siendo una de las principales motivaciones para participar en este proyecto, lo que obliga a los participantes salir de su zona de confort a la hora de diseñar soluciones.

En concreto, tres han sido los componentes estratégicos que han permitido a la compañía especializada en inteligencia de negocio alcanzar el séptimo puesto: innovación, creatividad y talento.

Entre los enfoques probados destacan las estrategias de tipo Boosting, redes neuronales recurrentes, cadenas de Markov, series temporales y métodos de stacking para el ensamblaje de distintos modelos

El concurso tuvo dos fases de características idénticas: inicialmente se contaba con más de dos meses para realizar los desarrollos que permitirían ir ajustando los modelos finales. Tras la creación de una tabla de modelización inicial, puesta en común para todo el equipo, se repartieron tareas y se paralelizaron distintas líneas de desarrollo analítico.

Cada integrante del equipo, a su vez, generó nuevas variables con el fin de crear modelos independientes y que diesen buenos resultados. Se probaron numerosas técnicas estadísticas, de minería de datos y machine learning y se pusieron en común para combinarlos en un modelo final.

Entre los enfoques probados destacan las estrategias de tipo Boosting, redes neuronales recurrentes, cadenas de Markov, series temporales y métodos de stacking para el ensamblaje de distintos modelos.

En cuanto al software empleado, se ha apostado por una variedad de ellos, utilizando indistintamente diferentes lenguajes de cálculo técnico como SAS, R, Python y Matlab. Se ha utilizado en cada paso el que se consideraba más adecuado, actualizado y potente.

Tras esa primera fase, los organizadores de la KDD Cup 2017 proporcionaron los datos con los que los diferentes equipos debían medir sus proyectos. Esto permitió recalibrar, actualizar y ensamblar los modelos. A partir de ese punto, se dispuso de cuatro días más para realizar las últimas pruebas, de las cuales se seleccionó automáticamente la mejor.

La motivación de los equipos

La KDD 2017, de la que forma parte la Cup, es la conferencia interdisciplinar más importante del mundo, que tendrá del 13 al 17 de agosto en Halifax, Canadá, y que reúne a investigadores y profesionales de la minería de datos, data analytics y Big Data. 

Para el equipo de Innova-tsn, participar en la KDD “aporta una motivación especial, que no siempre se tiene en el día a día, así como la posibilidad de trabajar con profesionales de diferentes áreas de la organización que comparten la misma ilusión y que dedican su tiempo voluntariamente a un proyecto, cuya finalidad es la satisfacción personal y las ganas de aprender, así como mejorar el aprendizaje, tanto en la modelización como en el análisis de datos. La copa KDD 2017 es un reto creativo que exige dedicación, esfuerzo y constancia”.

Pero Innova-tsn no se conforma con lo conseguido en la Cup de este año: va a s seguir apostando por participar en este tipo de concursos internacionales, sinónimo de innovación y de disrupción tecnológica y ya tiene el reto de estar entre los tres primeros del mundo en la KDD Cup 2018. Más información en www.Innova-tsn.com y en www.kdd.org/kdd2017

ShareThis

Publicidad

Publicidad

Publicidad

Opinión

Julio Campoy, Regional VP Broad Markets en Appian

El Data Fabric, clave para impulsar la digitalización del sector público

La digitalización de las organizaciones públicas es una cuestión crucial en un mundo cada vez más conectado y avanzado tecnológicamente. Para Julio Campoy, vicepresidente de Appian, una transformación esencial para facilitar y simplificar tanto los procesos internos como para los que se dirigen a los ciudadanos y en la que el Data Fabric cobra singular importancia

Soluciones

Nutreco despliega CloudSuite Food & Beverage de Infor en su plataforma sobre AWS

La compañía Nutreco, líder en nutrición animal, ha elegido CloudSuite Food & Beverage de Infor para estandarizar y armonizar procesos con soluciones nativas cloud desplegadas sobre la infraestructura y los servicios de Amazon Web Services

techWEEK info

TechWEEK forma parte de la red de información TI para profesionales de IDG Communications.


Sitios especializados de ITMedia NetWork: IT CIO.es, IT PYMES.es, IT SEGURIDAD.es, Strategic Partner, NUEVAempresa.com.

ITMedia NetWork. © 2006 - 2024 Information Technology & Media S.A. (CIF A-84950211). Todos los derechos reservados.

Envío de artículos por email de techWEEK.es

Por favor, introduzca la siguiente información











Cerrar

Envío de artículos por email de techWEEK.es

Procesando envíos...

Envío de artículos por email de techWEEK.es

Email enviado. Cerrar

Envío de artículos por email de techWEEK.es

Error en el envio. Pulse aqui para cerrar.Cerrar