Com aquisição do DataScience.com, Oracle desenvolveu plataforma de ciência de dados de nível empresarial focada na colaboração
Thor Olavsrud, CIO (EUA)
14/02/2020 às 17h00
A Oracle anunciou uma nova plataforma de ciência de dados baseada em nuvem. A solução, construída a partir do DataScience.com, que foi adquirido pela companhia em 2018, é voltada para equipes de cientistas de dados trabalhando em colaboração. Seus recursos incluem projetos compartilhados, catálogos de modelos, políticas de segurança, reprodutibilidade e auditabilidade.
A plataforma possui o serviço Oracle Cloud Infrastructure Data Science em seu núcleo. Ele fornece aos usuários a capacidade de criar, treinar e gerenciar algoritmos de aprendizado de máquina no Oracle Cloud usando Python, TensorFlow, Keras, Jupyter e outras ferramentas populares de ciência de dados. Seis serviços adicionais completam a solução, incluindo novos recursos de aprendizado de máquina integrados ao Oracle Autonomous Database, o Oracle Cloud Infrastructure Data Catalog, o Oracle Big Data Service, o Oracle Cloud SQL, o Oracle Cloud Infrastructure Data Flow e o Oracle Cloud Infrastructure Virtual Machines para Data Science.
“O serviço é realmente o primeiro do seu tipo em termos de ser nativo em nuvem”, disse Greg Pavlik, vice-presidente sênior de desenvolvimento de produtos da Oracle Data e AI Services. “Ele está focado em fornecer um ambiente de colaboração e governança para cientistas de dados.”
Segundo Pavlik, a oferta visa o ciclo de vida completo do aprendizado de máquina na empresa, o que significa que não se trata apenas de desenvolver ou treinar modelos, mas também de levar esses modelos para a produção e mantê-los. “Conforme os dados mudam, os modelos se tornam potencialmente menos válidos e os usuários precisam continuar os aproveitando dentro de aplicativos ou em relatórios analíticos. Por outro lado, eles precisam ter uma alta confiabilidade na sua reutilização, dando boas respostas”, acrescentou o executivo.
Simplificando a ciência de dados
Com o Oracle Cloud Infrastructure Data Science, a Oracle está adotando plataformas de concorrentes como Alteryx, KNIME Analytics Platform e RapidMiner, com foco na automação do fluxo de trabalho de ciência de dados.
A plataforma utiliza a seleção e o ajuste do algoritmo AutoML, usando modelos de aprendizado de máquina para selecionar o algoritmo mais adequado para aplicações específicas, ajudar o usuário a escolher entradas do algoritmo e ajustar os modelos. A solução também identifica automaticamente os principais recursos preditivos de conjuntos de dados maiores.
O Oracle Cloud Infrastructure Data Science auxilia, ainda, na avaliação do modelo, gerando um conjunto de métricas e visualizações para ajudar os usuários a medir o desempenho em relação a novos dados, classificando-os ao longo do tempo.