A Amazon anunciou a disponibilidade geral do Amazon SageMaker Lakehouse, um recurso que unifica dados em data lakes do Amazon Simple Storage Service (Amazon S3) e data warehouses do Amazon Redshift, ajudando você a criar análises poderosas e aplicativos de inteligência artificial e aprendizado de máquina (IA/ML) em uma única cópia de dados. O SageMaker Lakehouse faz parte da próxima geração do Amazon SageMaker, uma plataforma unificada para dados, análises e IA, que reúne recursos de aprendizado de máquina e análises da AWS amplamente adotados e oferece uma experiência integrada para análises e IA.
Os clientes querem fazer mais com os dados. Para se moverem mais rápido em sua jornada analítica, eles estão escolhendo o armazenamento e os bancos de dados certos para armazenar seus dados. Os dados estão espalhados por data lakes, data warehouses e diferentes aplicativos, criando silos de dados que dificultam o acesso e a utilização. Essa fragmentação leva a cópias duplicadas de dados e pipelines de dados complexos, o que, por sua vez, aumenta os custos para a organização. Além disso, os clientes são obrigados a usar mecanismos e ferramentas de consulta específicos, pois a maneira e o local onde os dados são armazenados limitam suas opções. Essa restrição dificulta sua capacidade de trabalhar com os dados como prefeririam. Por fim, o acesso inconsistente aos dados torna desafiador para os clientes tomarem decisões de negócios informadas.
O SageMaker Lakehouse aborda esses desafios ajudando você a unificar dados em data lakes do Amazon S3 e data warehouses do Amazon Redshift. Ele oferece a flexibilidade de acessar e consultar dados no local com todos os mecanismos e ferramentas compatíveis com o Apache Iceberg. Com o SageMaker Lakehouse, você pode definir permissões refinadas centralmente e aplicá-las em vários serviços da AWS, simplificando o compartilhamento de dados e a colaboração. Trazer dados para o seu SageMaker Lakehouse é fácil. Além de acessar dados perfeitamente de seus data lakes e data warehouses existentes, você pode usar zero-ETL de bancos de dados operacionais, como Amazon Aurora, Amazon RDS para MySQL, Amazon DynamoDB, bem como aplicativos como Salesforce e SAP. O SageMaker Lakehouse se encaixa em seus ambientes existentes.
Fiquei particularmente impressionado com a integração do SageMaker Lakehouse com outros serviços da AWS. Essa integração simplifica muito o gerenciamento e a análise de dados, tornando-os muito mais fáceis e eficientes. Acredito que este serviço será extremamente valioso para empresas que procuram melhorar suas capacidades analíticas e de IA.