Sketch

Aprimore seus fluxos de trabalho de dados com o Sketch, o assistente de IA de código aberto para pandas. Obtenha sugestões de código contextuais, insights de dados e análises mais rápidas — tudo sem plugins de IDE.

Ir para a IA
Sketch cover

Sobre o esboço

O que o Sketch faz pelos cientistas de dados

O Sketch é um assistente de codificação com inteligência artificial, desenvolvido especificamente para usuários do pandas. Ele aumenta a produtividade gerando código Python com base na estrutura e no conteúdo do seu DataFrame. Em vez de funcionar como um aplicativo ou plugin independente, ele se integra diretamente ao pandas por meio de uma simples extensão `.sketch`, oferecendo insights e sugestões em segundos.

Integração leve com Pandas

Com um simples `pip install sketch`, os usuários podem começar a acessar consultas em linguagem natural e trechos de código Python gerados automaticamente. A ferramenta não requer extensões ou configurações adicionais na IDE — basta importá-la e começar a fazer perguntas ou solicitar código em seu DataFrame existente.

Principais características do esboço

Perguntas e respostas em linguagem natural com .ask

A função `.ask` permite que os usuários consultem seu DataFrame em linguagem natural. O Sketch interpreta as perguntas usando estatísticas resumidas e metadados, fornecendo respostas compreensíveis em formato de texto. Seja para identificar tipos de dados ou entender a distribuição das colunas, `.ask` torna a exploração de dados intuitiva.

Código gerado automaticamente com .howto

Quando os usuários precisam de ajuda para escrever código pandas, o método `.howto` retorna trechos de código completos. Seja para plotar gráficos, limpar dados ou criar recursos, essa função acelera tarefas comuns de dados, gerando código pronto para uso com base nas instruções do usuário.

Capacidades avançadas

Análise dinâmica de dados via .apply

Para tarefas mais complexas, como geração de recursos ou análise de campos, a função `.apply` do Sketch permite que os usuários definam lógica personalizada em linguagem natural. Ela oferece suporte a modelos de prompts dinâmicos com marcadores de posição variáveis, possibilitando operações entre linhas usando pistas contextuais.

Compatibilidade com modelos locais e em nuvem

O Sketch funciona com APIs hospedadas (como o GPT da OpenAI) ou com modelos totalmente locais da Hugging Face, como o StarCoder. Com apenas algumas variáveis ​​de ambiente, os usuários podem alternar entre inferência de IA baseada em nuvem ou offline, dependendo de suas necessidades de privacidade e desempenho.

Como funciona o Sketch

Utilizando esboços de dados para contexto

Em sua essência, o Sketch resume a estrutura do DataFrame usando algoritmos aproximados conhecidos como «esboços de dados». Esses resumos fornecem informações importantes que alimentam grandes modelos de linguagem, ajudando-os a entender o contexto de um conjunto de dados antes de gerar sugestões.

Sem dependência de fornecedor ou configuração complexa.

O Sketch é de código aberto e não requer infraestrutura proprietária. Os usuários podem escolher seu backend de inferência, executá-lo localmente ou remotamente e até mesmo criar fluxos de trabalho personalizados com base na ferramenta, tornando-a flexível tanto para projetos pessoais quanto para pipelines de dados corporativos.

Casos de uso comuns

Geração de tags e metadados

Desde a identificação de informações pessoais identificáveis ​​(PII) até a geração de metadados descritivos, o Sketch auxilia nas tarefas de catalogação de dados com o mínimo de esforço manual. As funções `.ask` e `.apply` podem automatizar os processos de documentação e rotulagem.

Engenharia de Recursos e Visualização

Cientistas de dados podem gerar conjuntos de recursos, criar visualizações e responder a perguntas analíticas, tudo dentro de seus fluxos de trabalho do pandas. Com o Sketch, o tempo entre a pergunta e a obtenção de insights é significativamente reduzido.

Ferramentas Alternativas