Refraction
Refraction : outil de génération et de refactorisation de code basé sur l’IA
StarCoder est un modèle puissant de 15 milliards de paramètres, entraîné sur plus de 80 langages de programmation. Générez, complétez ou remplissez du code avec une grande précision grâce au modèle open source de Hugging Face.
StarCoder est un modèle de langage de grande envergure, développé par le projet BigCode, conçu pour générer et compléter du code source dans plus de 80 langages de programmation. Avec 15,5 milliards de paramètres et un apprentissage basé sur la complétion automatique, StarCoder prend en charge des tâches avancées de génération de code et aide les développeurs grâce à des complétions de haute qualité et contextuelles.
Conçu pour fonctionner efficacement sur du matériel moderne et déployé via Hugging Face, StarCoder est accessible aussi bien aux développeurs recherchant une assistance en matière de code qu'aux chercheurs évaluant des modèles de codage open source.
StarCoder a été entraîné sur l'ensemble de données dédupliquées The Stack (v1.2) et inclut du code issu de plus de 80 langages de programmation. Que vous travailliez en Python, JavaScript, C++ ou dans des langages plus spécifiques, le modèle s'adapte à votre environnement.
Contrairement à la génération traditionnelle de code de gauche à droite, StarCoder prend en charge les tâches de remplissage du milieu (FIM). Cela permet aux développeurs d'insérer des blocs de code manquants entre les sections existantes, améliorant ainsi la flexibilité de la saisie semi-automatique et de la génération d'extraits de code.
StarCoder utilise l'architecture GPT-2 avec attention multi-requêtes et une large fenêtre de contexte de 8192 jetons. Optimisé pour la compréhension et la génération de longues séquences de code structurées, il est idéal pour les tâches de développement logiciel concrètes.
Entraîné sur plus de 1 000 milliards de jetons, StarCoder a été construit à l'aide de 512 GPU A100 sur un cycle d'entraînement de 24 jours. L'ensemble de données a été filtré pour exclure le contenu désactivable et ne comprend que du code sous licence permissive.
StarCoder peut générer de nouvelles fonctions, compléter le code inachevé et faciliter l'écriture de code répétitif ou de logique répétitive. C'est un outil précieux pour le prototypage, l'apprentissage et l'automatisation des flux de développement.
StarCoder, en tant que modèle à accès libre sous la licence BigCode OpenRAIL-M, est idéal pour la recherche académique, l'évaluation comparative et la création d'applications en aval pour les tâches de codage.
Les développeurs peuvent utiliser StarCoder directement via Hugging Face Transformers en quelques lignes de code seulement. Il est entièrement accessible avec l'accélération GPU pour un déploiement local ou dans le cloud.
StarCoder est distribué sous la licence BigCode OpenRAIL-M. Bien que les données d'entraînement proviennent de code sous licence libre, il incombe aux utilisateurs de veiller à la bonne attribution des sources et au respect des conditions de la licence lors de l'utilisation du code généré.
Un index consultable est disponible pour retracer l'origine de tout segment de code généré, permettant aux développeurs de fournir une attribution appropriée lorsque cela est nécessaire.
StarCoder a démontré d'excellentes performances sur les tests de référence de programmation, notamment :
Ces résultats mettent en évidence l’efficacité du modèle pour les tâches de programmation à usage général.