StarCoder

स्टारकोडर 80 से ज़्यादा प्रोग्रामिंग भाषाओं पर प्रशिक्षित एक शक्तिशाली 15B पैरामीटर मॉडल है। हगिंग फेस के ओपन-सोर्स मॉडल का उपयोग करके उच्च सटीकता के साथ कोड जनरेट करें, पूरा करें या बीच में भरें।

एआई पर जाएं
StarCoder cover

स्टारकोडर के बारे में

अगली पीढ़ी का कोड जनरेशन मॉडल

स्टारकोडर, बिगकोड परियोजना द्वारा निर्मित एक विशाल भाषा मॉडल है, जिसे 80 से ज़्यादा प्रोग्रामिंग भाषाओं में सोर्स कोड बनाने और उसे पूरा करने के लिए डिज़ाइन किया गया है। 15.5 अरब मापदंडों और फिल-इन-द-मिडल प्रशिक्षण पर केंद्रित, स्टारकोडर उन्नत कोड निर्माण कार्यों का समर्थन करता है और डेवलपर्स को उच्च-गुणवत्ता, संदर्भ-जागरूक पूर्णता प्रदान करने में सहायता करता है।

डेवलपर्स और शोधकर्ताओं के लिए बनाया गया

आधुनिक हार्डवेयर पर कुशलतापूर्वक चलाने के लिए डिज़ाइन किया गया और हगिंग फेस के माध्यम से तैनात किया गया, स्टारकोडर कोड सहायता चाहने वाले डेवलपर्स और ओपन-सोर्स कोडिंग मॉडल का मूल्यांकन करने वाले शोधकर्ताओं दोनों के लिए सुलभ है।

विशेषताएँ और क्षमताएँ

बहुभाषी समर्थन

स्टारकोडर को डीडुप्लिकेटेड डेटासेट द स्टैक (v1.2) पर प्रशिक्षित किया गया है और इसमें 80 से ज़्यादा प्रोग्रामिंग भाषाओं के कोड शामिल हैं। चाहे आप पायथन, जावास्क्रिप्ट, C++, या किसी विशिष्ट भाषा में काम कर रहे हों, यह मॉडल आपके परिवेश के अनुकूल हो सकता है।

मध्य भाग भरें उद्देश्य

पारंपरिक बाएँ से दाएँ जेनरेशन के विपरीत, स्टारकोडर बीच में भरने (FIM) कार्यों का समर्थन करता है। यह डेवलपर्स को मौजूदा अनुभागों के बीच कोड के लुप्त ब्लॉक डालने की अनुमति देता है, जिससे स्वतः-पूर्णता और स्निपेट जेनरेशन का लचीलापन बढ़ जाता है।

तकनीकी मुख्य बिंदु

उन्नत मॉडल वास्तुकला

स्टारकोडर मल्टी-क्वेरी अटेंशन और एक बड़ी 8192-टोकन कॉन्टेक्स्ट विंडो के साथ GPT-2 आर्किटेक्चर का उपयोग करता है। यह लंबे, संरचित कोड अनुक्रमों को समझने और उत्पन्न करने के लिए अनुकूलित है, जो इसे वास्तविक दुनिया के सॉफ़्टवेयर विकास कार्यों के लिए आदर्श बनाता है।

विशाल प्रशिक्षण डेटासेट

1 ट्रिलियन से ज़्यादा टोकन पर प्रशिक्षित, स्टारकोडर को 24-दिवसीय प्रशिक्षण चक्र में 512 A100 GPU का उपयोग करके बनाया गया था। ऑप्ट-आउट सामग्री को बाहर करने के लिए डेटासेट को फ़िल्टर किया गया था और इसमें केवल अनुमति-प्राप्त लाइसेंस वाला कोड शामिल है।

उपयोग के मामले और अनुप्रयोग

कोड पूर्णता और निर्माण

स्टारकोडर नए फ़ंक्शन जनरेट कर सकता है, अधूरे कोड को पूरा कर सकता है, और बॉयलरप्लेट या दोहरावदार तर्क लिखने में सहायता कर सकता है। यह प्रोटोटाइपिंग, सीखने और विकास वर्कफ़्लो को स्वचालित करने के लिए एक उपयोगी उपकरण है।

अनुसंधान और प्रयोग

बिगकोड ओपनरेल-एम लाइसेंस के तहत एक ओपन-एक्सेस मॉडल के रूप में, स्टारकोडर शैक्षणिक अनुसंधान, बेंचमार्किंग और कोडिंग कार्यों के लिए डाउनस्ट्रीम अनुप्रयोगों के निर्माण के लिए आदर्श है।

ट्रांसफॉर्मर के साथ संगत

डेवलपर्स कुछ ही कोड लाइनों के साथ हगिंग फेस ट्रांसफॉर्मर्स के ज़रिए सीधे स्टारकोडर का इस्तेमाल कर सकते हैं। यह स्थानीय या क्लाउड परिनियोजन के लिए GPU त्वरण के साथ पूरी तरह से सुलभ है।

लाइसेंसिंग और जिम्मेदार उपयोग

ओपनरेल-एम लाइसेंस

स्टारकोडर को बिगकोड ओपनरेल-एम लाइसेंस के तहत जारी किया गया है। हालाँकि प्रशिक्षण डेटा खुले तौर पर लाइसेंस प्राप्त कोड से लिया गया था, फिर भी उपयोगकर्ता यह सुनिश्चित करने के लिए ज़िम्मेदार हैं कि उत्पन्न कोड का उपयोग करते समय उचित श्रेय दिया जाए और लाइसेंस आवश्यकताओं का पालन किया जाए।

एट्रिब्यूशन और पारदर्शिता

किसी भी उत्पन्न कोड खंड के मूल का पता लगाने के लिए एक खोज योग्य सूचकांक उपलब्ध है, जिससे डेवलपर्स को आवश्यकता पड़ने पर उचित श्रेय प्रदान करने की सुविधा मिलती है।

मूल्यांकन और प्रदर्शन

प्रतिस्पर्धी बेंचमार्क

स्टारकोडर ने कोडिंग बेंचमार्क पर मजबूत प्रदर्शन प्रदर्शित किया है, जिसमें शामिल हैं:

  • HumanEval (pass@1): 0.408 (prompted)
  • MBPP (pass@1): 0.527
  • MultiPL (Java, C++, Go): Competitive across multiple languages

ये स्कोर सामान्य प्रयोजन प्रोग्रामिंग कार्यों में मॉडल की प्रभावशीलता को उजागर करते हैं।

वैकल्पिक उपकरण