Refraction
Ferramenta de geração e refatoração de código com tecnologia de IA
StarCoder is a powerful 15B parameter model trained on 80+ programming languages. Generate, complete, or fill in the middle of code with high accuracy using Hugging Face’s open-source model.
StarCoder é um grande modelo de linguagem desenvolvido pelo projeto BigCode, projetado para gerar e completar código-fonte em mais de 80 linguagens de programação. Com 15,5 bilhões de parâmetros e foco em treinamento com preenchimento de lacunas, o StarCoder suporta tarefas avançadas de geração de código e auxilia desenvolvedores com conclusões de alta qualidade e baseadas em contexto.
Projetado para rodar eficientemente em hardware moderno e implantado via Hugging Face, o StarCoder é acessível tanto para desenvolvedores que buscam assistência de código quanto para pesquisadores que avaliam modelos de codificação de código aberto.
O StarCoder foi treinado no conjunto de dados desduplicado The Stack (v1.2) e inclui código de mais de 80 linguagens de programação. Seja trabalhando com Python, JavaScript, C++ ou linguagens de nicho, o modelo se adapta ao seu ambiente.
Ao contrário da geração tradicional da esquerda para a direita, o StarCoder suporta tarefas de preenchimento no meio (FIM). Isso permite que os desenvolvedores insiram blocos de código ausentes entre seções existentes, aumentando a flexibilidade do preenchimento automático e da geração de snippets.
O StarCoder utiliza a arquitetura GPT-2 com Atenção Multiconsulta e uma grande janela de contexto de 8192 tokens. Ele é otimizado para compreender e gerar sequências de código longas e estruturadas, tornando-o ideal para tarefas de desenvolvimento de software do mundo real.
Treinado em mais de 1 trilhão de tokens, o StarCoder foi desenvolvido usando 512 GPUs A100 em um ciclo de treinamento de 24 dias. O conjunto de dados foi filtrado para excluir conteúdo de exclusão voluntária e inclui apenas código com licença permissiva.
O StarCoder pode gerar novas funções, completar código inacabado e auxiliar na escrita de lógica padrão ou repetitiva. É uma ferramenta útil para prototipagem, aprendizado e automação de fluxos de trabalho de desenvolvimento.
Como um modelo de acesso aberto sob a licença BigCode OpenRAIL-M, o StarCoder é ideal para pesquisa acadêmica, benchmarking e construção de aplicativos downstream para tarefas de codificação.
Os desenvolvedores podem usar o StarCoder diretamente por meio do Hugging Face Transformers com apenas algumas linhas de código. Ele é totalmente acessível com aceleração de GPU para implantação local ou na nuvem.
O StarCoder é lançado sob a licença BigCode OpenRAIL-M. Embora os dados de treinamento tenham sido obtidos de código com licença aberta, os usuários são responsáveis por garantir a atribuição adequada e respeitar os requisitos da licença ao utilizar o código gerado.
Um índice pesquisável está disponível para rastrear a origem de qualquer segmento de código gerado, permitindo que os desenvolvedores forneçam a atribuição adequada quando necessário.
O StarCoder demonstrou forte desempenho em benchmarks de codificação, incluindo:
Essas pontuações destacam a eficácia do modelo em tarefas de programação de uso geral.