Refraction
Refraction: Ferramenta de geração e refatoração de código com inteligência artificial
O StarCoder é um poderoso modelo com 15 bilhões de parâmetros, treinado em mais de 80 linguagens de programação. Gere, complete ou preencha lacunas no código com alta precisão usando o modelo de código aberto da Hugging Face.
O StarCoder é um modelo de linguagem de grande porte, desenvolvido pelo projeto BigCode, projetado para gerar e completar código-fonte em mais de 80 linguagens de programação. Com 15,5 bilhões de parâmetros e foco no treinamento de preenchimento de lacunas (fill-in-the-middle), o StarCoder oferece suporte a tarefas avançadas de geração de código e auxilia os desenvolvedores com conclusões contextuais de alta qualidade.
Projetado para funcionar de forma eficiente em hardware moderno e implementado via Hugging Face, o StarCoder é acessível tanto para desenvolvedores que buscam auxílio com código quanto para pesquisadores que avaliam modelos de codificação de código aberto.
O StarCoder foi treinado no conjunto de dados deduplicado The Stack (v1.2) e inclui código de mais de 80 linguagens de programação. Seja você programador em Python, JavaScript, C++ ou linguagens de nicho, o modelo pode se adaptar ao seu ambiente.
Ao contrário da geração tradicional da esquerda para a direita, o StarCoder suporta tarefas de preenchimento no meio (FIM). Isso permite que os desenvolvedores insiram blocos de código ausentes entre as seções existentes, aumentando a flexibilidade do preenchimento automático e da geração de trechos de código.
O StarCoder utiliza a arquitetura GPT-2 com Atenção de Múltiplas Consultas e uma grande janela de contexto de 8192 tokens. Ele é otimizado para compreender e gerar sequências de código longas e estruturadas, tornando-o ideal para tarefas reais de desenvolvimento de software.
Treinado com mais de 1 trilhão de tokens, o StarCoder foi construído usando 512 GPUs A100 ao longo de um ciclo de treinamento de 24 dias. O conjunto de dados foi filtrado para excluir conteúdo de exclusão e inclui apenas código com licença permissiva.
O StarCoder pode gerar novas funções, completar código inacabado e auxiliar na escrita de código repetitivo ou código padrão. É uma ferramenta útil para prototipagem, aprendizado e automação de fluxos de trabalho de desenvolvimento.
Como um modelo de acesso aberto sob a licença BigCode OpenRAIL-M, o StarCoder é ideal para pesquisa acadêmica, avaliação comparativa e desenvolvimento de aplicações subsequentes para tarefas de codificação.
Os desenvolvedores podem usar o StarCoder diretamente por meio do Hugging Face Transformers com apenas algumas linhas de código. Ele é totalmente acessível com aceleração por GPU para implantação local ou em nuvem.
O StarCoder é distribuído sob a licença BigCode OpenRAIL-M. Embora os dados de treinamento tenham sido obtidos de código com licença aberta, os usuários são responsáveis por garantir a atribuição correta e respeitar os requisitos da licença ao usar o código gerado.
Um índice pesquisável está disponível para rastrear a origem de quaisquer segmentos de código gerados, permitindo que os desenvolvedores forneçam a atribuição adequada quando necessário.
O StarCoder demonstrou um desempenho sólido em testes de benchmark de programação, incluindo:
Esses resultados destacam a eficácia do modelo em tarefas de programação de propósito geral.