Atualmente muitas empresas tem adotado plataformas de dados renomadas no mercado como Snowflake, Databricks entre outras.

E quase sempre os dados chegam nessa plataforma através de um dos storages das principais clouds do mercado:

E em todas conseguimos utilizar o Knime, nesse artigo iremos trazer como ler arquivos parquet do S3 com o Knime.

E para isso é necessário seguir alguns passos:

Começando pela autenticação do S3.

É importante ter um usuário criado na AWS e suas credenciais, para informar o Access Key ID e Secret Key.

E informar a região

E depois clicar em Test Connection.

Uma vez que conectamos neste primeiro node, agora iremos utilizar o node: Amazon S3 Connector.

Que é o mais simples, basta informar o nome do bucket.

E para fechar, iremos utilizar o node Parquet Reader, e basta informarmos o diretório aonde está o arquivo

E dessa forma temos os dados de clientes que estão no S3 prontos para podermos criar os nossos fluxos de dados.

Espero que tenha gostado.

Conheça o nosso Ebook do Knime Troopers.

Muito Obrigado.

Rafael Arruda

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *