विस्फोटन
२०, जनवरी २०२५ एआई च्याटबट लञ्च गर्यो । यसको नाम हो—डीपसीक च्याटबट आर—१ । डीपसीकको लञ्चले आर्टिफिसियल इन्टेलिजन्सका बारेमा बनाइएका कैयौं रहस्यहरु उजागर भएका छन् । यी यस्ता रहस्यहरु थिए—पहिलो कुरा एआई सजिलोसँग बन्दैन । दोस्रो, थोरै लगानीमा हुदैँन । तेस्रो, यसले धेरै उर्जा खपत गर्दछ । चौथो, यो सबैलाई निःशुल्क उलब्ध गराउन सकिदैन । पाँचौं, यसको निर्माणमा ठूलो दक्ष जनशक्ति चाहिन्छ । यी कुरालाई पुष्टि गर्दै ७ जुन २०२३ मा भारतमा भएको द इकोनोमिकले गरेको खुला बहसमा ओपेन एआईका कार्यकारी अधिकृत सामुअल अल्टम्यानले घमण्डका साथ भनेका थिए कि ‘—हामी यसका बारेमा कसरी सोच्न सक्दछौं, तपाईलाई थाहा छ, १०० मिलियनले प्रभावकारी एआई बनाउन सक्दछौं ? के हामी ठूला मोडेलसँग प्रतिस्पर्धा गर्न सक्दछौं ? हामीले बाहेक कसैले पनि एआई बनाउन सक्दैन । यदि ठूला कम्पनीसँग प्रतिस्पर्धा गर्ने कुरा हो भने फाउण्डेशनल मोडेल बनाउने कुरा असम्भव जस्तै हो ।
डीपसीकको सार्वजनिकी पश्चात अमेरिकाका राष्ट्रपति डोलान्ड ट्रमले २८ जनवरी २०२५का दिन सार्वजनिक सञ्चारमाध्यममा “चिनियाँ कम्पनीबाट डीपसीक एआईको सार्वजनिक विमोचन एक चेतावनीको घण्टि हुनुपर्दछ ।” भन्ने प्रतिक्रिया दिएका थिए । हुन पनि त्यस्तै भयो । डीपसीकको लञ्चले ओपेन एआईको चाट जीपीटी, मेटाको लामा, गुगलको जेमिनाई एडभान्स जस्ता एकलौटी बजार बनाएका एआईलाई एकै झड्कामा पछाडि पारिदिएको थियो । यसको सबैभन्दा अचम्म लाग्दो कुरा के हो भने यो सबैकालागि निःशुल्क प्रयोग प्राप्त छ । जबकी ओपेन एआई प्रो मोडेल प्रयोग गर्न प्रतिमहिना २०० डलर प्रतिमहिना शुल्क लिन्छ । यसैले गर्दा डीपसीक डाउन लोड गर्ने संख्या यति धेरै बढ्छ कि जसले गर्दा २७ जनवरी २०२५ पुग्दै गर्दा अमेरिकाको वित्तीय बजारमा हलचल मचिन्छ ।
डीपसीक आउनुभन्दा पहिला अमेरिकी एनभीडीयाको मूल्याक्न थियो ३.५ ट्रिलियन अमेरिकी डलर । तर एकैदिनमा त्यसको मूल्यांकन झरेर २.९ ट्रिलियन अमेरिकी डलर पुगेको थियो । यो कम्पनीले एआई र कम्प्युरमा बनाउन प्रयोग गर्ने चिप्स बनाउँदथ्यो । साथै यो कम्पनीको शेयर एकै दिनमा १७ प्रतिशतले ओरालो लागेको थियो ।
यतिमात्र नभएर डीपसीकलाई तालिम गर्ने मूल्य केवल ३.५८ मिलियन डलर मात्र खर्च लागेको छ । जबकि गुगलले १०० बिलियन डलर, ओपेन एआईले ३०० बिलियन खर्च गरेको थियो ।
डीपसीक अघिका एआईका अवस्था
द इकोनोमिक टाइम्सले ७ जुन २०२३ मा दिल्लीमा ओपेन एआईका कार्यकारी अधिकृत स्यामुअल अल्टम्यानसँग लामो कुराकानी गरेको थियो । वार्ताका क्रममा उनीसँग के भारतले एआई बनाउन सक्छ भन्ने प्रश्न सोधिएको थियो । उक्त प्रश्नको उत्तरमा उनले घमण्डका साथ भनेका थिए—हामी बाहेक कसैले बनाउ सक्दैन । तपाईहरु प्रयास गर्न सक्नु हुन्छ र मन पराउन सक्नु हुन्छ, जे भए पनि प्रयास गर्नु तपाईँको काम हो । तर यो पूर्णतय निराशाजनक कुरा हो ।’
हुन पनि किन नहोस् एउटा एआई प्रबन्ध गर्न मात्र २०० मेगावाट प्रतिघन्टा विजुली खर्च हुन्छ, बिलियन डलरभन्दा कम खर्च लाग्दैन र विश्वकै अतिदक्ष सयौं प्रविधिक, इञ्जिनियरहरुलाई काम लगाइन्छ भन्ने भाष्य बनाइएको थियो । डीपसीकको सार्वजनिकीकरण भएपछि यस्ता भ्रमपूर्ण भाष्य बदलिएका छन् ।
कसरी तयार पारियो डीपसीक ?
डीपसीकलाई तयार गर्दैगर्दा एउटा विस्तृत परियोजना पत्र तयार पारिएको थियो । उक्त पत्रको शुरुमा नै उपशिर्षकमा लेखिएको थियो जसको नेपालीकरण यस्तो हुन्छ,—दीर्घकालीन सोचसहित खुला स्रोत कृतिम बुद्धिमताको भाषाका नमूनाहरुको विस्तार ।
डीपसीकको परियोजना पत्रको सारमा जे लेखिएको छ त्यो नै त्यसको अवधारणा र प्राविधिक पक्ष हो । यसमा भनिएको छ कि खुला स्रोत लामा भाषा जसलाई प्राविधिक भाषामा ओपेन सोर्स लार्ज ल्याङ्वेज मोडेल(एलएलएम) भनिन्छ, यसको तीब्र विकास साँच्चै नै उल्लेखनीय भएको छ । यद्यपी, अघिल्लो साहित्यमा वर्णन गरिएका स्केलिङ ल(जब कुनै मोडेलको आकार, प्रशिषण डाटा वा गणनात्मक स्रोतहरुको बृद्धिमा कसरी परिवर्तन भन्ने कुराको वर्णन हुन्छ ।) जसले एलएलएमहरुको स्केलिङ्ग माथि अँध्यारो बादल मडारिएको छ । हामी स्केलिङ लको अध्ययनमा गहिराइसम्म पुग्छौं र हाम्रो विशेष खोजहरू प्रस्तुत गर्छौं, जसले दुई व्यापक रूपमा प्रयोग हुने ७ बी र ६७ बी(एआई भाषमा दिलियन प्यारामिटर्स हुन्छ ।) ओपेन–सोर्स कन्फिगरेसन(कुनै प्रणाली, सफ्टवेयर, वा उपकरणहरुको सेटिङ, व्यवस्था,वा अनुकुल प्रक्रियालाई जनाउँछ ।) हरूमा ठूला मोडेलहरूको स्केलिङलाई सहज बनाउँछ । स्केलिङ ल द्वारा निर्देशित हुँदै, हामी DeepSeek LLM प्रस्तुत गर्छौं, जुन दीर्घकालीन दृष्टिकोणसहित खुला–स्रोत भाषा मोडेलहरूलाई अगाडि बढाउने परियोजना हो । पूर्व–प्रशिक्षण चरणलाई समर्थन गर्न हामीले हाल २ ट्रिलियन टोकन (ठूलो डेटा सेटको एक घटक, जसले शब्द, वर्ण वा वाक्यांशलाई प्रतिनिधित्व गर्न सक्छ ।)हरू समावेश गर्ने डेटासेट विकास गरेका छौं र यो निरन्तर विस्तार भइरहेको छ । हामी DeepSeek LLM आधार मोडेलहरूमा सुपरिवेक्षित फाइन–ट्युनिङ (SFT) र प्रत्यक्ष प्राथमिकता अनुकूलन (DPO) पनि सञ्चालन गर्छौं, जसले गर्दा DeepSeek च्याट मोडेलहरू सिर्जना हुन्छन् । हाम्रो मूल्याङ्कन नतिजाहरूले देखाउँछ कि DeepSeek LLM ६७B ले विशेष गरी कोड, गणित, र तर्कको क्षेत्रमा बेन्चमार्क (कुनै विशेष कार्य वा कार्यहरूको सेटमा विभिन्न एआई मोडेल वा प्रणालीहरूको कार्यसम्पादन मूल्याङ्कन र तुलना गर्न प्रयोग गरिने मानकीकृत परीक्षण वा डेटासेट ।) को दायरामा LLaMA–२७०B लाई उछिनेको छ । यसबाहेक, ओपेन—इन्डिट इभ्यालुएशन (धेरै वैध उत्तर अवस्थित प्रश्नको जवाफ दिन प्रेरित गरेर मोडेलको क्षमताको मूल्याङ्कन गर्दछ, जसमा साधारण शुद्धता मेट्रिक्सभन्दा बाहिर मूल्याङ्कन विधि आवश्यक पर्दछ ।) ले हाम्रो DeepSeek LLM ६७B च्याटले GPT–३.५ को तुलनामा उत्कृष्ट प्रदर्शन प्रदर्शन गरेको देखाउँछ ।
प्राविधिक भाषा भएकाले माथिको उल्था सहज बन्न सकेको छैन । तै पनि यसले के देखाएको छ भने डीपसीकले यसअघिको सबैभन्दा चर्चित, महंगो र अतिउत्तम मानिएको च्याटबट आपेन एआई (जीपीडी मोडेल, ०१ र ०३ मोडेलहरु, डेएल ई ३ )लाई धेरै कुरामा पछाडि पारिदिएको छ ।
डीपसीक बनाउने परियोजनाका प्रमुख ४० वर्षका चिनीयाँ उद्यमी लियाङ वेनफेङ हुन् । २०१५ मा वेनफेङले हाइ फ्लायर नामको एउटा हेज (यो कृत्रिम बुद्धिमत्ता (AI) प्रविधिको प्रयोग गरी जोखिम न्यूनीकरण गर्न र पूँजी संरक्षण गर्न सम्बन्धित छ, जसमा सम्भावित कमजोरीहरू पहिचान गरिन्छ र वास्तविक समयमा बजार प्रवृत्तिहरूको आधारमा व्यापारिक निर्णयहरू सक्रिय रूपमा समायोजन गरिन्छ ।) बनाएका थिए । २०१९ मा यिनले हाइ फ्लायर एआई बनाएका थिए र आर्टिफिसिएल इन्टेलिजेन्सको एल्गोरिदमका बारेमा अनुसन्धान गरेका थिए । २०२३ मा उनले डीपसीक बनाउनका लागि कोष खडा गरेका थिए । डीपसीक बनाउन उनले कुनै विशेषज्ञलाई लिएका थिएनन् बरु विश्वविद्यालयमा टोपोलोजी/तथ्यांकशास्त्री/अपरेशन रिसर्च/साइबरनेटिक्समा विद्यावारधी गरिराखेका विद्यार्थीलाई लिएका थिए । यो एआई बनाउन उनले सबैभन्दा अप्ठ्यारा प्रश्नका उत्तर खोज्न समय बिताए र केवल २ वर्षमा उनले यो एआई तयार पारेका थिए । त्यसमा केही मिलियन डलर मात्र खर्च भएको थियो । यसलाई बनाउन केवल २ सय जना सहभागि थिए र ती मध्ये ९५ प्रतिशतको उमेर ३० वर्षभन्दा कम थियो ।
डीपसीक किन चर्चामा ?
स्यामुल अल्टम्यानको कम्पनी ओपेन एआई बनाउँदा कम्तिमा पनि ३ हजार ५ सय दक्ष जनशक्तिलाई काममा लगाइएको थियो । जब कि डीपसीक बनाउँदा केवल २ जनालाई मात्र काम लगाइएको थियो । यो चेन थट ओपेन मोडेल हो जसरी ओपेन एआई थियो । ओपेन एआई जस्तै डीपसीक पनि एडभान्स रिजनिङ मोडेल हो जसले कुनै पनि प्रश्नको जवाफ दिनु भन्दा पहिला मान्छेको जस्तै सोच्दछ । डीपसीकले जवाफ दिनाुभन्दा अघि के के सोच्यो भन्ने कुरा पनि देखाउँदछ । यो ओपेन सोर्स सफ्टवेयर हो । यसको कोड सार्वजनिकरुपमा नै उपलब्ध छ । यसको कोड नै डाउनलोड गर्न सकिन्छ । यहाँसम्म कि यसको कोड आफ्नो तरिकाले बदल्न सकिन्छ । परिमार्जन पनि गर्न सकिन्छ । माइक्रोसफ्टले २९ र जनवरी ३० मा अमेरिकी कम्पनी परपेक्सिलिटी एआईले एकीकृत गरेको समाचार पीसी एमजीले ३० जनवरीमा बनाएको थियो । जब कि ओपेन एआईले सबैका लागि खुला भनेको थियो । यसकालागि पैसा तिर्नु पर्दथ्यो । त्यसलाई ब्यग्यं गर्दै एलोन मस्कले ६ मार्च २०२४ का दिन एक्समा ‘टु क्लोज एआई, एण्ड आई विल ड्रप द लसुट ’ लेखेका थिए ।
यसको अर्को पक्ष हो कृतिम विश्लेषण हो । मानव मूल्यांकनको आधारमा कोडिङमा डीपसीक सबैभन्दा माथि ९८ प्रतिशतमा रहेको छ । क्वान्टिट्याटिभ रिजनिङमा पनि डीपसीक सबैभन्दा माथि ९७ प्रतिशत रहेको छ । पीसी म्यागजिनले गरेको अध्ययनले न्युज नलेजमा डीपसीक अगाडि छ । क्यालकुलेशनमा डीपसीक र च्याट जीपीटी बराबर रहेको छ । रिडल समाधान गर्नमा डीपसीक राम्रो छ । तर यसलाई सोधिएको प्रश्नको उत्तर दिन समय लगाउँछ । डीपसीकलाई प्रश्न सोधियो भने यसले प्रत्येक विधाकालागि फरक फरक विशेषज्ञ मोडलमा विकास गरेको छ । यी मोडेलहरुमा ईञ्जिनियर, डक्टर, वकिलको कामलाई फरक फरक तरिकाले राखिएको छ । यसले गर्दा यसमा कम प्यामिटरले पनि धेरै काम गर्न सक्ने बनाइएको छ । यसले गर्दा यसको क्षमता अधिक बढेको छ भने मूल्य असाध्यै कम । साथै डीपसीकले एनभिडिआईको पुरानो मोडेल कम्प्युर प्रयोग गर्नु परेको थियो ।
डीपसीकबाट के सिक्ने ?
डीपसीकको लञ्च सँगै धेरै कुरा बाहिर आएका छन् । पहिलो कुरा असाध्यै सस्तोमा अत्याधुनिक एआई बनेको छ । ओपेन एआईलाई ट्रेन गर्न ३०० बिलियन अमेरिकी डलर खर्च भएको थियो । जब कि डीपसीकलाई ट्रेन गर्न केवल ५.५८ मिलियन डलर मात्र खर्च भएको थियो । यो तथ्यले गरिब राष्ट्रले पनि कम मूल्य लगाएर एआई टे्रन गर्न सक्दछन् भन्ने पुष्टि गरेको छ । स्यामुअल अल्टम्यानले भनेको जस्तो होपलेस अवस्था अब रहेन ।
यसको निर्माणमा विश्वका अतिदक्ष प्राविधिक, इञ्जिनियरको आवश्यकता पर्ने भाष्यलाई पनि बदलिदिएको छ । देश भित्रकै विद्यार्थीको क्षमतालाई प्रयोग गर्न सकिदो रहेछ ।
यसको निर्माणमा उच्च क्षमताका सेमिकन्डक्टर, अत्याधुनिक कम्प्युटरको आवश्यकता पर्दछ भनी देखाइएको हाउलाई निस्तेज गरिदिएको छ ।
डीपसीकको आगमनले विश्व प्रविधि क्षेत्रमा नयाँ सम्भावना र नवप्रबद्धनको ढोका खोलिदिएको छ । साथै पश्चिमा देशमा सीमित भएको प्रविधि विकास, नवप्रबद्धनको क्षेत्र बदलिदिएको छ । र, अब उच्च प्रविधि सस्तिन बाध्य भएको छ ।
प्रतिक्रिया