ad

Ticker

10/recent/ticker-posts

Breaking barriers: AI and Assamese language of North East

एआई और उत्तर पूर्व की असमिया भाषा


हर दूसरे दिन जब हम समाचार लेख पढ़ते हैं या डिजिटल मीडिया की दुनिया के बारे में जानकारी लेते हैं तो हम कुछ वाक्यांशों और बयानों से परिचित होते हैं - कृत्रिम बुद्धिमत्ता दुनिया में तूफान ला रही है', 'क्या मशीनें इंसानों की जगह ले लेंगी?', 'कृत्रिम बुद्धिमत्ता' आधी सदी के भीतर मानव बुद्धि को प्रतिस्थापित करें' इत्यादि। भले ही यह कितना भी चिंताजनक लगे, हम अभी भी इस तथ्य से इनकार नहीं कर सकते हैं कि कृत्रिम बुद्धिमत्ता (एआई) ने भी सभी के लिए जीवन को आसान बना दिया है। एक बटन के क्लिक से लोगों का जीवन अधिक सुविधाजनक हो गया है। ऐसी दुनिया में जहां डिजिटल मीडिया और इंटरनेट लगभग सभी निवासियों के लिए एक बुनियादी आवश्यकता बन गए हैं, एएल जैसे तकनीकी नवाचारों का अधिकतम उपयोग करना आवश्यक है।

AI and Assamese language of North East


जैसे-जैसे अधिक से अधिक लोग प्रौद्योगिकी और इंटरनेट की दुनिया से परिचित हो रहे हैं, प्रौद्योगिकी को सभी के लिए सुलभ बनाने की आवश्यकता पैदा होती है। प्रौद्योगिकी के अलावा, एआई भी असाधारण रूप से संचार से संबंधित है, जो न केवल मानव और मशीनों के बीच सुचारू संचार को सक्षम बनाता है बल्कि मानव-मानव संचार में बाधाओं को भी तोड़ता है। यह संचार आवश्यक रूप से किसी मशीन के निष्पादन के लिए तकनीकी आदेशों पर ध्यान केंद्रित नहीं करता है, बल्कि मनुष्यों के बीच संचार के प्राकृतिक रूप को भी समाहित करता है - वह भाषा जो हम बोलते हैं या वह भाषा जो हमें दुनिया से जोड़ती है।


भाषा और अल के बीच अंतर्निहित घनिष्ठ संबंध को समझा जा सकता है यदि हम इसमें दो विशेषताओं का अवलोकन करते हैं - कैसे वाक्यविन्यास मशीन सीखने में डेटा का योगदान देता है, जबकि अन्य उन प्लेटफार्मों को बढ़ाने पर ध्यान केंद्रित करते हैं जिनका हम हर दिन उपयोग करते हैं जैसे कि फेसबुक जैसे बुनियादी सोशल मीडिया प्लेटफॉर्म। इंस्टाग्राम या वर्चुअल एजेंट जैसे सिरी, गूगल असिस्टेंट, एलेक्सा। इन सभी के कार्य करने के लिए

सरलता से, अल को मानव भाषा को समझने और बनाने और इसके पीछे की मानवीय भावनाओं को समझने में सक्षम होने की आवश्यकता है। एआई नेचुरल लैंग्वेज प्रोसेसिंग (एनएलपी), डीप लर्निंग और मशीन लर्निंग जैसे टूल का उपयोग करके एक भाषा सीख सकता है।


असमिया भारतीय उपमहाद्वीप में बोली जाने वाली सबसे पुरानी भाषाओं में से एक है और शोध प्रकाशन एथनोलॉग के अनुसार, यह वर्तमान में 15 मिलियन वक्ताओं द्वारा बोली जाती है। असमिया को इस क्षेत्र की 'भाषा-भाषा' भी माना जाता है और यह भारतीय संविधान के अनुसार एक अनुसूचित भाषा है। इस तथ्य के बावजूद कि असमिया सदियों से व्यापक रूप से बोली जाती रही है, भाषा की तकनीकी प्रगति अभी भी सुप्त अवस्था में है। असमिया में लिखित या मौखिक साहित्य की जांच करना पर्याप्त नहीं है, बदलते तकनीकी मानकों के अनुकूल भाषा की क्षमता का आकलन करना भी महत्वपूर्ण है। फेसबुक का उपयोग करते समय एक व्यक्तिगत अनुभव का जिक्र करते हुए, मुझे असम के 'ग्रेपफ्रूट' के रूप में एक बहुत प्रसिद्ध राजनीतिक व्यक्ति के बारे में एक तस्वीर में एक कैप्शन का अल-जनरेटेड अनुवादित संस्करण मिला। हाल ही में, मैंने व्हाट्सएप पर एक तस्वीर देखी, जिसमें एक विशेष प्रकार के चावल 'इकोनॉमी बॉयल्ड राइस' का कुछ बेतुके शब्द में गलत अनुवाद किया गया था। हम अक्सर 'अनुवाद' बटन पर क्लिक करते हैं या आवाज पहचान उपकरण में डेटा दर्ज करते हैं और फिर आउटपुट प्राप्त करने के बाद मजाक और मनोरंजन में संलग्न होते हैं। वर्तनी की त्रुटियों या उच्चारण में अशुद्धि को न भूलें। आवाज उत्पन्न करने वाले उपकरणों में गलत उच्चारण के संबंध में एक और व्यक्तिगत अनुभव, मेरी चचेरी बहन पब सरानिया, गुवाहाटी में रहती है और जब भी मैं उसके घर जाता हूं, मैं Google मानचित्र में उसका पता दर्ज करता हूं। ऐप में अल की आवाज में स्थान का गलत उच्चारण 'पब सारानी' बताया गया है, जो सुनने में काफी अप्रिय है।


असमिया भाषा की तकनीकी उन्नति समय की मांग क्यों है? प्रौद्योगिकी और वैश्वीकरण में तेजी से प्रगति के साथ, दुनिया भर के लोग अपने संचार के बीच की बाधाओं को तोड़ने के लिए लगातार तालमेल बनाए रखने और आम भाषाओं को सीखने और जमा करने की कोशिश कर रहे हैं। एआई की दुनिया में असमिया भाषा के लिए खुद को प्रौद्योगिकी के साथ अद्यतन करना भी आवश्यक है। कृत्रिम बुद्धिमत्ता जैसी नई तकनीकों को अपनाने के लिए, इसे प्रौद्योगिकी में सबसे आगे होना चाहिए और भाषा के पास एक विशाल डेटाबेस होना चाहिए जिससे नई

प्रौद्योगिकियाँ ज्ञान प्राप्त कर सकती हैं। पर्याप्त संसाधन उपलब्ध कराए जाने चाहिए ताकि आधुनिक तकनीक के संदर्भ में भाषा को सभी के लिए सुलभ बनाया जा सके। असमिया को यूनिकोड में शामिल करने की उनकी मांग के बावजूद, लोगों को केवल एक प्रस्ताव मिला कि इसके लिए एक बंगाली लिपि, जिसका नाम बदलकर 'बंगाली-असमिया' कर दिया गया था, का उपयोग किया जाए। इस पहलू में, भाषा का हिस्सा बनने के लिए अधिक समावेशिता की आवश्यकता है

विश्व का तकनीकी डेटाबेस। एक चुनौती इस तथ्य में निहित है कि प्रौद्योगिकी की शुरूआत के बाद विकसित हुए कई शब्दों और शब्दों का कोई मूल समकक्ष नहीं है। 'कंप्यूटर' 'डेस्कटॉप' 'ड्रोन' 'स्मार्टफोन' आदि जैसे शब्दों के लिए कोई विशिष्ट मूल शब्द नहीं है। इसलिए किसी भी मशीन में इनपुट देते समय उन शब्दों का लिप्यंतरण या सही ढंग से उच्चारण करने की आवश्यकता होती है।

उपर्युक्त चुनौतियों के बावजूद, हमें उस सकारात्मक प्रगति से दूर नहीं जाना चाहिए जो असमिया भाषा संस्थानों, भाषा विशेषज्ञों, मशीन डेवलपर्स और कृत्रिम बुद्धिमत्ता के क्षेत्र में अल प्रोग्रामर की मदद से कर रही है। ऑनलाइन संसाधन, यूट्यूब वीडियो और इंस्टाग्राम रील्स इस विकास की दिशा में हर किसी द्वारा अपने घरों से उठाए गए सबसे छोटे कदम हैं। आज, हमारे पास है

लगभग सभी ऐप्स या प्लेटफ़ॉर्म में भाषा बदलने के विकल्प और विकल्पों की ऐसी सूची में असमिया सुविधाएँ। राज्य के प्रमुख संस्थान जैसे तेजपुर विश्वविद्यालय, गौहाटी विश्वविद्यालय और पूरे भारत के संस्थान जैसे आईआईटीएस, सीआईआईएल मैसूर टेक्स्ट कॉर्पस, सिनसेट, एमटी, वर्डनेट इत्यादि जैसे अधिक टूल को शामिल करने और ऑनलाइन बनाने की पूरी कोशिश कर रहे हैं। असमिया भाषा के लिए उपलब्ध संसाधन।


असम सरकार द्वारा लागू की जा रही एनईपी 2020 का उद्देश्य सीखने के माध्यम के रूप में असमिया को शामिल करना है, जिसका अर्थ है कि असमिया में अधिक ऑनलाइन संसाधन उपलब्ध होंगे, जो असमिया भाषा के भविष्य के रोडमैप की दिशा में एक सकारात्मक कदम है। हमें केंद्र सरकार द्वारा स्थानीय भाषाओं को भाषा प्रौद्योगिकी के साथ एकीकृत करने की पहल को भी नहीं भूलना चाहिए, जैसे कि भारतीय भाषाओं के लिए प्रौद्योगिकी विकास, ताकि मानव-मशीन को भाषा की बाधा के बिना बातचीत करने में सुविधा हो सके। इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय के तहत राष्ट्रीय भाषा अनुवाद मिशन, जिसे 'भाषिणी' के नाम से भी जाना जाता है, का उद्देश्य "सभी भारतीयों को अपनी भाषाओं में इंटरनेट और डिजिटल सेवाओं तक आसान पहुंच प्रदान करना और सामग्री में वृद्धि करना है।" भारतीय भाषाएँ"।


डिजिटल इंडिया-भाषिणी मिशन के तहत, आईआईटी मद्रास ने पूरे भारत में 22 भाषाओं में अनुवाद, ट्रांसक्रिप्शन और वॉयस डेटा पहचान के क्षेत्र में अधिक डेटासेट बनाकर भारतीय भाषाओं को सशक्त बनाने के लिए 'एआई4भारत' नामक एक परियोजना विकसित की है। इस परियोजना के तहत, वर्तमान में, सात एनोटेटर्स और भाषा विशेषज्ञों का एक समूह, लगभग नौ ट्रांसक्रिप्शनिस्ट और गुणवत्ता विश्लेषक और कई भाषण डेटा समन्वयक असमिया टीम का हिस्सा रहे हैं, जिन्होंने इंडिककॉर्प जैसे AI4भारत द्वारा हासिल किए गए सभी महत्वपूर्ण मील के पत्थर में बड़े पैमाने पर योगदान दिया है। बीपीसीसी, श्रुतिलिपि, काथबाथ, इंडिकबीईआरटी, इंडिक ट्रांस, इंडिकएक्सलिट, इंडिकवेव2वेक, इंडिकव्हिस्पर, टीटीएस, सुप्रीम कोर्ट के लिए सामग्री का अनुवाद करते हुए, सहज आवाज-संचालित लेनदेन को सक्षम करते हैं। भावना विश्लेषण और मशीन अनुवाद के लिए मशीन मॉडल को प्रशिक्षित करने के लिए विभिन्न डेटासेट विकसित किए गए हैं।


इसलिए, हम देखते हैं कि राज्य में सामाजिक-राजनीतिक चुनौतियों के बावजूद, असमिया भाषा ने विभिन्न शोधकर्ताओं और भाषाविदों और सरकार के सामूहिक प्रयासों से महत्वपूर्ण प्रगति की है। विशेष रूप से एआई के क्षेत्र में, हर कोई असमिया भाषा की प्राकृतिक भाषा प्रसंस्करण के लिए नए डेटासेट और उपकरण बनाने की पूरी कोशिश कर रहा है। किसी भाषा को एआई जैसी नई तकनीकों द्वारा अपनाए जाने के लिए, एक भाषा को प्रौद्योगिकी में सबसे आगे होना चाहिए, तभी ये नई प्रौद्योगिकियां भाषा सीखने और इसे बोलने वाले लोगों के साथ संवाद करने, सवालों के जवाब देने, अनुवाद करने और बनाने में सक्षम होंगी। सामग्री, भाषण और लिखित दोनों।


इस तथ्य के बावजूद कि असमिया सदियों से व्यापक रूप से बोली जाती रही है, भाषा की तकनीकी प्रगति अभी भी सुप्त अवस्था में है।


असमिया में लिखित या मौखिक साहित्य की जांच करना पर्याप्त नहीं है, बल्कि बदलते तकनीकी मानकों के अनुकूल भाषा की क्षमता का आकलन करना भी महत्वपूर्ण है।

Post a Comment

0 Comments