ग्लोवेट्रिक्स श्रवण बाधित लोगों को फिर से बोलने में मदद करने के लिए एआई दस्ताने बनाता है
उत्पादक प्रौद्योगिकियों के वैश्विक विस्फोट के बाद से कृत्रिम होशियारी 2022 में टेक्नोलॉजी शहर में चर्चा का विषय बन गई है। यह केवल बड़े भाषा मॉडल (एलएलएम) आधारित एआई के बारे में नहीं है, बल्कि प्रौद्योगिकी की सभी विभिन्न शाखाओं में विकास और अनुप्रयोग के मामले में तेजी से वृद्धि देखी गई है। एआई ने भी डिजिटल क्षेत्र को छोड़कर वास्तविक दुनिया में प्रवेश किया है, जिससे लोगों को अपना जीवन बेहतर बनाने में मदद मिली है। भाषा अनुवाद उपकरण जल्दी पता लगाने के बीमारियाँ, इसने समाज के सभी क्षेत्रों को प्रभावित किया है।
पुणे स्थित एक भारतीय स्टार्टअप ग्लोवाट्रिक्स का लक्ष्य भी बोलने और सुनने संबंधी विकारों से पीड़ित लोगों के लिए इसी तरह की समस्या का समाधान करना है। एक के अनुसार प्रतिवेदन विश्व स्वास्थ्य संगठन (डब्ल्यूएचओ) के अनुसार, दुनिया भर में 1.5 अरब लोग किसी न किसी स्तर पर सुनने की क्षमता में कमी से पीड़ित हैं। हालाँकि संगठन वाणी विकारों पर ऐसा डेटा नहीं रखता है, लेकिन संभावना है कि इसकी संख्या भी लाखों में है। कई मामलों में, ये लोग संवाद करने के लिए या तो लिखित संचार या सांकेतिक भाषा पर भरोसा करते हैं। जबकि पहला संचार को बहुत धीमा कर सकता है, दूसरे को सांकेतिक भाषा को बोले गए शब्दों में अनुवाद करने के लिए श्रोता के पास एक दुभाषिया की आवश्यकता होती है।
यह स्थिति अक्सर नौकरी पाने में कठिनाई पैदा कर सकती है, खासकर अगर यह ग्राहक-सामना वाली हो या बहुत अधिक संचार की आवश्यकता हो। लेकिन यहीं पर ग्लोवाट्रिक्स जैसी कंपनियां आती हैं। भारतीय स्टार्टअप फिफ्थ सेंस नामक एआई-संचालित डिवाइस पर काम कर रहा है जो वास्तविक समय में सांकेतिक भाषा के इशारों को भाषण में बदल सकता है और मौखिक विकलांगता वाले लोगों को प्रभावी ढंग से और बिना सहायता के संवाद करने में मदद कर सकता है। गैजेट्स 360 पर, हमने उत्पाद और इसके पीछे की तकनीक के बारे में अधिक जानने के लिए स्टार्टअप के सह-संस्थापकों से बात की।
ग्लोवाट्रिक्स, एक भारतीय एआई स्टार्टअप
ग्लोवाट्रिक्स की स्थापना 2021 में सह-संस्थापक ऐश्वर्या कर्नाटकी और परीक्षित सोहोनी द्वारा की गई थी, और दोनों कंपनी के सह-सीईओ के रूप में काम करते हैं। कर्नाटकी की मुलाकात 2009 में एक श्रवण-बाधित बच्चे से हुई, जिसने उन्हें सांकेतिक भाषा सीखने के लिए प्रेरित किया और उनकी बातचीत ने उन लोगों के लिए एक अंतर का बीज बोया जो समान भाग्य से पीड़ित हैं। फिफ्थ सेंस में बीज तब अंकुरित हुआ जब उसकी मुलाकात साथी सह-संस्थापक सोहोनी से हुई, जो भविष्य कहनेवाला विश्लेषण में व्यापक अनुभव वाला एक डेटा वैज्ञानिक था, जिसने अपने परिवार के भीतर इन संघर्षों का अनुभव किया और तुरंत इस कारण से जुड़ने में सक्षम था।
दोनों ने तीन लोगों की एक टीम बनाने के लिए बानेर, पुणे में एक इंजीनियर के साथ एक साझा कार्यालय स्थान में काम किया। अपने दृष्टिकोण को स्पष्ट करते हुए, कर्नाटकी ने कहा: “हमारा दृष्टिकोण सभी क्षमताओं के लोगों के बीच निर्बाध संचार की सुविधा प्रदान करना है और प्रत्येक बधिर और कम सुनने वाले व्यक्ति को खुद को व्यक्त करने और उनकी प्राकृतिक भाषा – भाषा संकेतों में सुनने की क्षमता देना है। »
सुनने में अक्षम लोगों के लिए फिफ्थ सेंस, एआई-संचालित दस्ताने
फॉर्म फैक्टर परिप्रेक्ष्य से, एआई-संचालित डिवाइस एक दस्ताने जैसा दिखता है जिस पर एक स्मार्टवॉच रखी गई है। सोहोनी ने हमें बताया कि एआई दस्ताने हल्के कपड़े से बने होते हैं जिन्हें बिना किसी परेशानी के लगातार 6-8 घंटे तक पहना जा सकता है। दस्तानों के शीर्ष पर एक खुला भाग है जहां से उंगलियां बाहर आ सकती हैं जिससे उपयोगकर्ता स्मार्टफोन या किसी अन्य कार्य का उपयोग कर सकता है जिसमें अतिरिक्त पकड़ की आवश्यकता होती है। कपड़ा एक से सुसज्जित है चतुर घड़ी और किए गए सभी इशारों को पकड़ने के लिए कई सेंसर। कपड़ा स्वयं अलग करने योग्य है और इसे अलग से धोया भी जा सकता है।
हार्डवेयर के लिए, सोहोनी ने बताया कि कंपनी डिवाइस में उपयोग किए जाने वाले घटकों को विभिन्न देशों से प्राप्त करती है और फिर कंपनी के आंतरिक डिजाइन के आधार पर उन्हें अलग से बनाती है। यह भारत में काम करने वाली अधिकांश पहनने योग्य कंपनियों द्वारा अपनाया गया एक मानक मॉडल है।
लेकिन यह सॉफ्टवेयर में है कि ग्लोवाट्रिक्स ने अपना नवाचार लाया। इस प्रणाली में दो भाग हैं जो निर्बाध दोतरफा संचार की अनुमति देते हैं। पहला स्वयं डिवाइस है, जो एआई द्वारा संचालित है, और दूसरा एक सहयोगी ऐप है। सोहोनी ने कहा: “एआई आर्किटेक्चर पूरी तरह से इन-हाउस विकसित किया गया था क्योंकि हमारे पास देखने के लिए कोई बेंचमार्क नहीं था। » दिलचस्प बात यह है कि ग्लोवाट्रिक्स जेनरेटिव एआई का उपयोग नहीं करता है, बल्कि अपने जेस्चर-टू-स्पीच इंटरफ़ेस के लिए मशीन लर्निंग और विभिन्न प्रकार के विश्लेषण एल्गोरिदम के मिश्रण का उपयोग करता है।
जब कोई इशारा किया जाता है, तो साथी ऐप इसे ऑडियो में परिवर्तित करता है और श्रोता को स्ट्रीम करता है। जब श्रवण बाधित व्यक्ति को बिना सांकेतिक भाषा के वक्ता की बात सुननी होती है तो यह एक रिसीवर के रूप में भी कार्य करता है। एप्लिकेशन ध्वनि सुनता है और फिर उसे टेक्स्ट में परिवर्तित करता है जिसे उपयोगकर्ता पढ़ सकता है। दिलचस्प बात यह है कि ऐप न केवल बोले गए शब्दों को बल्कि दरवाजे की घंटी बजने जैसी अन्य आवाजों को भी पकड़ लेता है। कंपनी का यह भी दावा है कि डिवाइस वास्तविक समय में काम करता है, जिससे निर्बाध संचार की अनुमति मिलती है।
ग्लोवाट्रिक्स गोपनीयता और कनेक्टिविटी चुनौतियों का समाधान कैसे करता है
इस तरह के स्मार्ट उपकरणों के साथ आम समस्याएं कनेक्टिविटी और गोपनीयता हैं। अधिकांश स्मार्ट डिवाइस, विशेष रूप से वे जो AI का उपयोग करते हैं, सर्वर पर गणना और प्रक्रिया करते हैं। इसका मतलब यह है कि अंतराल-मुक्त अनुभव के लिए तेज़ और कार्यात्मक इंटरनेट आवश्यक है। इसी तरह, स्मार्ट उपकरणों को अपनी कार्यक्षमता प्रदान करने के लिए बहुत सारा उपयोगकर्ता डेटा एकत्र करने की आवश्यकता होती है। इस डेटा को सर्वर पर रखने से उल्लंघन की स्थिति में गोपनीयता संबंधी चिंताएं भी बढ़ सकती हैं।
ग्लोवाट्रिक्स ने दोनों समस्याओं का समाधान ढूंढ लिया है। ऐप का संपूर्ण रिसीवर भाग डिवाइस पर किया जाता है, जिसका अर्थ है कि टेक्स्ट में रूपांतरण के लिए एकत्र किया गया कोई भी उपयोगकर्ता-साइड ऑडियो डिवाइस को कभी नहीं छोड़ता है। यह हिस्सा लैग-फ्री भी है क्योंकि इसमें सक्रिय इंटरनेट कनेक्टिविटी की आवश्यकता नहीं है। जेस्चर-टू-स्पीच रूपांतरण के बारे में, सोहोनी ने कहा कि कनेक्टिविटी समस्या को खत्म करने के लिए कुछ महत्वपूर्ण शब्द और व्यक्तिगत अक्षर भी ऐप में ही जोड़े जाएंगे। हालाँकि, चूँकि AI मॉडल को शक्तिशाली कंप्यूटर प्रोसेसिंग की आवश्यकता होती है, बाकी काम क्लाउड पर होगा, जिसके लिए एक स्थिर इंटरनेट कनेक्शन की आवश्यकता होगी। विशेष रूप से, कंपनी का क्लाउड भी मूल रूप से बनाया गया है और इससे भारतीय उपयोगकर्ताओं के लिए सर्वर-डिवाइस कनेक्टिविटी को अनुकूलित करने में मदद मिलने की उम्मीद है।
यहां ध्यान देने वाली एक बात यह है कि भले ही एआई को भारतीय सांकेतिक भाषा में प्रशिक्षित किया गया है और यह टेक्स्ट को हिंदी और मराठी में परिवर्तित करता है, एक इन-ऐप टेक्स्ट ट्रांसलेशन टूल अंग्रेजी और अधिकांश भारतीय क्षेत्रीय भाषाओं में ऑडियो उत्पन्न करने में सक्षम होगा।
उत्पाद-बाज़ार के लिए उपयुक्त ढूँढना
फिफ्थ सेंस फिलहाल एक प्रोटोटाइप है और सोहोनी ने खुलासा किया कि कंपनी जल्द ही अपना पहला पायलट परीक्षण शुरू करेगी। स्टार्टअप को यह भी भरोसा है कि वह अगले छह महीनों के भीतर उत्पाद-बाज़ार में फिट होने में सक्षम होगा।
भले ही उत्पाद विपणन के लिए तैयार न हो, ग्लोवाट्रिक्स ने पहले ही अपने डिवाइस का प्रभाव देख लिया है। उनका दावा है कि बोलने में बाधा वाला एक व्यक्ति अपने वार्ताकार के साथ संवाद करने के लिए पांचवीं इंद्रिय का उपयोग करने के बाद नौकरी पाने में कामयाब रहा।
और उत्पाद की कीमत क्या हो सकती है? सोहोनी ने कहा कि एआई दस्ताने का दृष्टिकोण प्रतिस्पर्धी मूल्य बनाए रखना है ताकि वे जनता तक पहुंच सकें। हालांकि उन्होंने किसी विशेष कीमत का खुलासा नहीं किया, लेकिन कहा कि इसकी कीमत एक मिड-रेंज स्मार्टफोन जितनी हो सकती है। इसके अतिरिक्त, कीमत कम करने के लिए, ग्लोवाट्रिक्स एक सदस्यता-आधारित राजस्व मॉडल भी तलाश रहा है, जो अंतिम उपभोक्ता पर बोझ को और कम कर सकता है।