Red de información TI para profesionales ITMedia NetWork

lunes, 09 de septiembre de 2024
Actualizado a las 14:43


Búsqueda avanzada

Publicidad

Publicidad

Informes

Disponible Cloud Data Science, la plataforma de Oracle para proyectos de ciencia de datos

27 Febrero 2020por Redacción

Ya está disponible la plataforma Cloud Data Science de Oracle que, como una propuesta de servicios que incluye catálogo de datos, aprendizaje automático, distribuciones de Cloudera Hadoop y Apache Spark, ayuda a las empresas a construir, capacitar, administrar e implementar colaborativamente modelos de aprendizaje automático para aumentar el éxito de los proyectos de ciencia de datos.

La empresa ofrece siete nuevos servicios, incluido un nuevo catálogo de datos, para descubrir, encontrar, organizar, enriquecer y crear activos de datos.

Así, a diferencia de otros productos de ciencia de datos más enfocados a entornos de datos individuales, Oracle Cloud Infrastructure Data Science ayuda a mejorar la efectividad de los equipos de ciencia de datos con capacidades como proyectos compartidos, catálogos de modelos, políticas de seguridad de equipo, reproducibilidad y auditabilidad.

Los modelos efectivos de aprendizaje automático son la base de proyectos de éxito de ciencia de datos, pero el volumen y la variedad de datos que enfrentan las empresas pueden parar estas iniciativas antes de que despeguen

Greg Pavlik

Además, la plataforma selecciona automáticamente los conjuntos de datos de entrenamiento óptimos a través de la selección y el ajuste del algoritmo AutoML, la evaluación y la explicación del modelo.

Para Oracle, las organizaciones solo se dan cuenta de una fracción del enorme potencial de transformación de los datos porque los equipos de ciencia de datos no tienen fácil acceso a los mismos ni a las herramientas adecuadas para construir e implementar modelos efectivos de aprendizaje automático.

El resultado es que los modelos tardan demasiado en desarrollarse, no siempre cumplen con los requisitos empresariales de precisión y robustez y con demasiada frecuencia nunca llegan a producción.

“Los modelos efectivos de aprendizaje automático son la base de proyectos de éxito de ciencia de datos, pero el volumen y la variedad de datos que enfrentan las empresas pueden parar estas iniciativas antes de que despeguen”, explica Greg Pavlik, vicepresidente sénior de Product Development en Oracle Data and AI Services.

“Con Oracle Cloud Infrastructure Data Science estamos mejorando la productividad de los científicos de datos individuales mediante la automatización de todo su flujo de trabajo y agregando un soporte sólido del equipo para la colaboración de cara a ayudar a garantizar que los proyectos de ciencia de datos entreguen un valor real a las empresas”.

Con Cloud Infrastructure Data Science estamos mejorando la productividad de los científicos de datos individuales mediante la automatización de todo su flujo de trabajo y agregando un soporte sólido del equipo para la colaboración de cara a ayudar a garantizar que los proyectos de ciencia de datos entreguen un valor real a las empresas

Greg Pavlik

Según la compañía, el factor diferenciador clave para su plataforma de ciencia de datos son las características de colaboración en equipo y la estrecha integración con una variedad de fuentes de datos disponibles en OCI.

Así, Cloud Data Science Platform admite el entorno de trabajo interactivo Jupyter Notebook, que permite desarrollar código en Python y construir e implementar modelos de aprendizaje automático, y desarrolladores y científicos de datos tienen a su disposición entornos de desarrollo sobre máquinas virtuales y almacenamiento en bloques: una sesión creada en una red virtual en la nube (VCN) con los permisos apropiados puede acceder a los contenidos del Autonomous Data Warehouse (ADW).

Además, pueden utilizar librerias familiares como Pandas para obtener datos del ADW y realizar análisis y visualización de datos, acercando así el análisis predictivo al almacén de datos históricos.

Por otra parte, esencial en la propuesta de Oracle es que los algoritmos de aprendizaje automático se integran con Autonomous Database de la firma con un nuevo soporte para Python y AutoML. Una integración esencial para desarrollar modelos utilizando algoritmos de fuente abierta y escalables en la base de datos.

Al agregar capacidades AutoML a la plataforma de ciencia de datos se automatiza la selección y el ajuste de algoritmos, el ejecutar pruebas contra múltiples algoritmos y las configuraciones de hiperparámetros.

Cloud Data Science Platform también incluye máquinas virtuales OCI para Data Science respaldadas por GPU, Oracle Big Data Service basado en la implementación completa de Cloudera Hadoop, un catálogo de datos que permite a los usuarios descubrir, encontrar, organizar, enriquecer y rastrear activos de datos en Oracle Cloud, Cloud SQL, que permite consultas SQL sobre datos en HDFS, Hive, Kafka, NoSQL y Object Storage.

Con todo ello, Oracle llega con armas preparadas para competir con AWS, Azure, Google Cloud e IBM, que cuentan con servicios de machine learning (ML) en PaaS desde hace años, aparte de que dado que las bases de datos y las cargas de trabajo basadas en datos son clave para para la compañía de Redwood Shores, disponer de un servicio ML integrado va tener buena acogida por sus clientes interesados en desarrollar aplicaciones inteligentes. Aparte de que, a través de AutoAL, ofrece capacidades únicas integrando almacén de datos.

Para equipos de ciencia de datos y científicos

Más en profundidad, Cloud Infrastructure Data Science incluye flujo de trabajo automatizado de ciencia de datos, ahorra tiempo y reduce errores gracias a capacidades entre las que destacan:

  • AutoML la selección y ajuste automatizado de algoritmos facilita el proceso de ejecución de pruebas contra múltiples algoritmos y configuraciones de hiperparámetros - Comprueba la precisión de los resultados y confirma que se selecciona el modelo y la configuración óptimos para su uso. Esto ahorra un tiempo significativo para los científicos de datos y, lo que es más importante, está diseñado para permitir que cada científico de datos obtenga los mismos resultados que los profesionales más experimentados.
  • La selección automática de características predictivas simplifica la ingeniería de características al identificar automáticamente las características predictivas clave de conjuntos de datos más grandes.
  • La evaluación del modelo genera un conjunto completo de métricas de evaluación y visualizaciones adecuadas para medir el rendimiento del modelo frente a nuevos datos y puede clasificar los modelos a lo largo del tiempo para permitir un comportamiento óptimo en la producción. La evaluación del modelo va más allá del rendimiento bruto para tener en cuenta el comportamiento de referencia esperado y utiliza un modelo de costes para que los diferentes impactos de falsos positivos y negativos se puedan incorporar por completo.
  • Explicación del modelo - Cloud Data Science proporciona una explicación automatizada de la ponderación relativa y la importancia de los factores que intervienen en la generación de una predicción. La plataforma ofrece la primera implementación comercial de la explicación independiente del modelo. Con un modelo de detección de fraude, por ejemplo, un científico de datos puede explicar qué factores son los principales impulsores del fraude para que la empresa pueda modificar procesos o implementar salvaguardas.

Más información en www.oracle.com y en www.oracle.com/data-science/cloud-infrastructure-data-science.html

ShareThis

Publicidad

Publicidad

Publicidad

Opinión

Bill Waid, director de tecnología en FICO

La importancia del trabajo en equipo en los procesos de innovación y aceleración

El científico estadounidense Thomas Alva Edison llegó a registrar más de un millar de inventos a lo largo de su vida y, sin embargo, no pudo patentar el que para muchos fue su hallazgo más importante: 'la factoría de inventos', un concepto sobre el que Bill Waid, chief product and technology officer en FICO, reflexiona y anima a que se aplique a estrategias de colaboración, innovación y aceleración

Soluciones

Porsche elige a NetApp como partner de infraestructura inteligente de datos

NetApp da nuevos pasos en su colaboración con Porsche Motorsport y se convierte en su partner exclusivo de infraestructura inteligente de datos, acelerando el acceso a los datos de Porsche y la toma de decisiones en pista. El acuerdo construye una nueva relación entre NetApp y el equipo Porsche Penske Motorsport en el campeonato IMSA WeatherTech SportsCar (IWSC) y en el Mundial de Resistencia (World Endurance Championship), así como un apoyo continuado al equipo TAG Heuer Porsche de Fórmula E

techWEEK info

TechWEEK forma parte de la red de información TI para profesionales de IDG Communications.


Sitios especializados de ITMedia NetWork: IT CIO.es, IT PYMES.es, IT SEGURIDAD.es, Strategic Partner, NUEVAempresa.com.

ITMedia NetWork. © 2006 - 2024 Information Technology & Media S.A. (CIF A-84950211). Todos los derechos reservados.

Envío de artículos por email de techWEEK.es

Por favor, introduzca la siguiente información











Cerrar

Envío de artículos por email de techWEEK.es

Procesando envíos...

Envío de artículos por email de techWEEK.es

Email enviado. Cerrar

Envío de artículos por email de techWEEK.es

Error en el envio. Pulse aqui para cerrar.Cerrar