Refraction
Refraction: инструмент генерации и рефакторинга кода на базе ИИ
StarCoder — это мощная модель с 15B параметрами, обученная более чем на 80 языках программирования. Создавайте, дополняйте или заполняйте код с высокой точностью, используя модель с открытым исходным кодом Hugging Face.
StarCoder — это крупная языковая модель, созданная в рамках проекта BigCode и предназначенная для генерации и дополнения исходного кода на более чем 80 языках программирования. Благодаря 15,5 миллиардам параметров и фокусировке на обучении с заполнением в середине, StarCoder поддерживает сложные задачи генерации кода и помогает разработчикам получать высококачественные, контекстно-зависимые дополнения.
Разработанный для эффективной работы на современном оборудовании и развертываемый с помощью Hugging Face, StarCoder доступен как разработчикам, нуждающимся в помощи с написанием кода, так и исследователям, оценивающим модели кодирования с открытым исходным кодом.
StarCoder был обучен на дедуплицированном наборе данных The Stack (v1.2) и включает код более чем 80 языков программирования. Независимо от того, работаете ли вы на Python, JavaScript, C++ или других специализированных языках, модель адаптируется к вашей среде.
В отличие от традиционной генерации слева направо, StarCoder поддерживает задачи заполнения посередине (FIM). Это позволяет разработчикам вставлять недостающие блоки кода между существующими разделами, повышая гибкость автодополнения и генерации фрагментов.
StarCoder использует архитектуру GPT-2 с функцией Multi-Query Attention и большим контекстным окном на 8192 токена. Он оптимизирован для понимания и генерации длинных структурированных последовательностей кода, что делает его идеальным для реальных задач разработки программного обеспечения.
StarCoder, обученный на более чем 1 триллионе токенов, был создан с использованием 512 графических процессоров A100 в течение 24-дневного цикла обучения. Набор данных был отфильтрован для исключения контента, не подлежащего проверке, и включает только код с разрешительной лицензией.
StarCoder может генерировать новые функции, дополнять незавершённый код и помогать в написании шаблонного кода или повторяющейся логики. Это полезный инструмент для создания прототипов, обучения и автоматизации процессов разработки.
Являясь моделью с открытым доступом по лицензии BigCode OpenRAIL-M, StarCoder идеально подходит для академических исследований, сравнительного анализа и создания приложений для задач кодирования.
Разработчики могут использовать StarCoder напрямую через Hugging Face Transformers, написав всего несколько строк кода. StarCoder полностью доступен с графическим ускорением для локального или облачного развертывания.
StarCoder выпускается под лицензией BigCode OpenRAIL-M. Хотя данные для обучения были получены из кода с открытой лицензией, пользователи несут ответственность за правильное указание источника и соблюдение лицензионных требований при использовании сгенерированного кода.
Для отслеживания происхождения любых сгенерированных сегментов кода доступен поисковый индекс, что позволяет разработчикам при необходимости указывать правильное авторство.
StarCoder продемонстрировал высокие результаты в тестах кодирования, включая:
Эти оценки подчеркивают эффективность модели при решении задач программирования общего назначения.