Refraction
रिफ्रैक्शन: एआई-संचालित कोड जनरेशन और रिफैक्टरिंग टूल
स्टारकोडर 80 से ज़्यादा प्रोग्रामिंग भाषाओं पर प्रशिक्षित एक शक्तिशाली 15B पैरामीटर मॉडल है। हगिंग फेस के ओपन-सोर्स मॉडल का उपयोग करके उच्च सटीकता के साथ कोड जनरेट करें, पूरा करें या बीच में भरें।
स्टारकोडर, बिगकोड परियोजना द्वारा निर्मित एक विशाल भाषा मॉडल है, जिसे 80 से ज़्यादा प्रोग्रामिंग भाषाओं में सोर्स कोड बनाने और उसे पूरा करने के लिए डिज़ाइन किया गया है। 15.5 अरब मापदंडों और फिल-इन-द-मिडल प्रशिक्षण पर केंद्रित, स्टारकोडर उन्नत कोड निर्माण कार्यों का समर्थन करता है और डेवलपर्स को उच्च-गुणवत्ता, संदर्भ-जागरूक पूर्णता प्रदान करने में सहायता करता है।
आधुनिक हार्डवेयर पर कुशलतापूर्वक चलाने के लिए डिज़ाइन किया गया और हगिंग फेस के माध्यम से तैनात किया गया, स्टारकोडर कोड सहायता चाहने वाले डेवलपर्स और ओपन-सोर्स कोडिंग मॉडल का मूल्यांकन करने वाले शोधकर्ताओं दोनों के लिए सुलभ है।
स्टारकोडर को डीडुप्लिकेटेड डेटासेट द स्टैक (v1.2) पर प्रशिक्षित किया गया है और इसमें 80 से ज़्यादा प्रोग्रामिंग भाषाओं के कोड शामिल हैं। चाहे आप पायथन, जावास्क्रिप्ट, C++, या किसी विशिष्ट भाषा में काम कर रहे हों, यह मॉडल आपके परिवेश के अनुकूल हो सकता है।
पारंपरिक बाएँ से दाएँ जेनरेशन के विपरीत, स्टारकोडर बीच में भरने (FIM) कार्यों का समर्थन करता है। यह डेवलपर्स को मौजूदा अनुभागों के बीच कोड के लुप्त ब्लॉक डालने की अनुमति देता है, जिससे स्वतः-पूर्णता और स्निपेट जेनरेशन का लचीलापन बढ़ जाता है।
स्टारकोडर मल्टी-क्वेरी अटेंशन और एक बड़ी 8192-टोकन कॉन्टेक्स्ट विंडो के साथ GPT-2 आर्किटेक्चर का उपयोग करता है। यह लंबे, संरचित कोड अनुक्रमों को समझने और उत्पन्न करने के लिए अनुकूलित है, जो इसे वास्तविक दुनिया के सॉफ़्टवेयर विकास कार्यों के लिए आदर्श बनाता है।
1 ट्रिलियन से ज़्यादा टोकन पर प्रशिक्षित, स्टारकोडर को 24-दिवसीय प्रशिक्षण चक्र में 512 A100 GPU का उपयोग करके बनाया गया था। ऑप्ट-आउट सामग्री को बाहर करने के लिए डेटासेट को फ़िल्टर किया गया था और इसमें केवल अनुमति-प्राप्त लाइसेंस वाला कोड शामिल है।
स्टारकोडर नए फ़ंक्शन जनरेट कर सकता है, अधूरे कोड को पूरा कर सकता है, और बॉयलरप्लेट या दोहरावदार तर्क लिखने में सहायता कर सकता है। यह प्रोटोटाइपिंग, सीखने और विकास वर्कफ़्लो को स्वचालित करने के लिए एक उपयोगी उपकरण है।
बिगकोड ओपनरेल-एम लाइसेंस के तहत एक ओपन-एक्सेस मॉडल के रूप में, स्टारकोडर शैक्षणिक अनुसंधान, बेंचमार्किंग और कोडिंग कार्यों के लिए डाउनस्ट्रीम अनुप्रयोगों के निर्माण के लिए आदर्श है।
डेवलपर्स कुछ ही कोड लाइनों के साथ हगिंग फेस ट्रांसफॉर्मर्स के ज़रिए सीधे स्टारकोडर का इस्तेमाल कर सकते हैं। यह स्थानीय या क्लाउड परिनियोजन के लिए GPU त्वरण के साथ पूरी तरह से सुलभ है।
स्टारकोडर को बिगकोड ओपनरेल-एम लाइसेंस के तहत जारी किया गया है। हालाँकि प्रशिक्षण डेटा खुले तौर पर लाइसेंस प्राप्त कोड से लिया गया था, फिर भी उपयोगकर्ता यह सुनिश्चित करने के लिए ज़िम्मेदार हैं कि उत्पन्न कोड का उपयोग करते समय उचित श्रेय दिया जाए और लाइसेंस आवश्यकताओं का पालन किया जाए।
किसी भी उत्पन्न कोड खंड के मूल का पता लगाने के लिए एक खोज योग्य सूचकांक उपलब्ध है, जिससे डेवलपर्स को आवश्यकता पड़ने पर उचित श्रेय प्रदान करने की सुविधा मिलती है।
स्टारकोडर ने कोडिंग बेंचमार्क पर मजबूत प्रदर्शन प्रदर्शित किया है, जिसमें शामिल हैं:
ये स्कोर सामान्य प्रयोजन प्रोग्रामिंग कार्यों में मॉडल की प्रभावशीलता को उजागर करते हैं।