सोरा ओपनएआई का नया टेक्स्ट-टू-वीडियो जनरेटर है: यहां हम टूल के बारे में जानते हैं
सोरा इस प्रकार की तकनीक का प्रदर्शन करने वाले पहले व्यक्ति नहीं हैं। लेकिन उद्योग विश्लेषक अब तक दिखाए गए टूल के वीडियो की उच्च गुणवत्ता की ओर इशारा करते हैं और ध्यान देते हैं कि इसका परिचय ओपनएआई और सामान्य रूप से टेक्स्ट-टू-वीडियो पीढ़ी के भविष्य के लिए एक महत्वपूर्ण कदम है।
हालाँकि, जैसा कि तीव्र विकास के संदर्भ में सभी चीजों के साथ होता है एआई स्पेस आज, ऐसी तकनीक इसके संभावित नैतिक और सामाजिक प्रभावों के बारे में भी आशंका पैदा करती है। यहां वह है जो आपको जानना आवश्यक है।
सोरा क्या है? क्या मैं अब भी इसका उपयोग कर सकता हूँ? सोरा एक टेक्स्ट-टू-वीडियो जनरेटर है जो जेनरेटिव एआई का उपयोग करके लिखित संकेतों के आधार पर 60 सेकंड तक लंबे वीडियो बनाता है। मॉडल मौजूदा स्थिर छवि से एक वीडियो भी उत्पन्न कर सकता है।
जेनरेटिव एआई एआई की एक शाखा है जो कुछ नया बना सकती है। उदाहरणों में ओपनएआई के चैटजीपीटी जैसे चैटबॉट और डीएएलएल-ई और मिडजर्नी जैसे छवि जनरेटर शामिल हैं। वीडियो बनाने के लिए AI सिस्टम प्राप्त करना नया और अधिक कठिन है, लेकिन यह उसी तकनीक पर निर्भर करता है।
सोरा अभी तक सार्वजनिक उपयोग के लिए उपलब्ध नहीं है (ओपनएआई का कहना है कि यह टूल को आधिकारिक तौर पर जारी करने से पहले नीति निर्माताओं और कलाकारों के साथ जुड़ रहा है) और अभी भी बहुत कुछ है जो हम नहीं जानते हैं। लेकिन गुरुवार की घोषणा के बाद से, कंपनी ने यह दिखाने के लिए कि वह क्या कर सकती है, कुछ नमूना सोरा-जनरेटेड वीडियो साझा किए हैं।
उन कहानियों की खोज करें जिनमें आपकी रुचि है
ओपनएआई के सीईओ सैम अल्टमैन ने भी सोशल मीडिया उपयोगकर्ताओं से त्वरित विचार भेजने के लिए कहने के लिए एक्स, जिसे पहले ट्विटर के नाम से जाना जाता था, का सहारा लिया। इसके बाद उन्होंने यथार्थवादी, विस्तृत वीडियो साझा किए, जो “पहाड़ की चोटी पर पॉडकास्टिंग करते दो गोल्डन रिट्रीवर्स” और “ड्रोन कैमरे के साथ साइकिल चलाने वाले एथलीटों के रूप में विभिन्न जानवरों के साथ एक समुद्री बाइक दौड़” जैसे संकेतों का जवाब देते थे। हालाँकि सोरा-जनरेटेड वीडियो जटिल और अविश्वसनीय रूप से विस्तृत दृश्यों को चित्रित कर सकते हैं, ओपनएआई नोट करता है कि अभी भी कुछ कमजोरियाँ हैं, जिनमें कुछ स्थानिक और कारण-और-प्रभाव तत्व शामिल हैं। उदाहरण के लिए, OpenAI अपनी वेबसाइट पर जोड़ता है: “एक व्यक्ति कुकी को काट सकता है, लेकिन बाद में कुकी पर काटने का निशान नहीं हो सकता है।”
क्या आज अन्य एआई-जनित वीडियो उपकरण मौजूद हैं? ओपनएआई का सोरा अपनी तरह का पहला नहीं है। गूगलजिन कंपनियों ने समान तकनीक का प्रदर्शन किया है उनमें मेटा और स्टार्टअप रनवे एमएल शामिल हैं।
फिर भी, उद्योग विश्लेषक अब तक साझा किए गए सोरा वीडियो की स्पष्ट गुणवत्ता और प्रभावशाली लंबाई की ओर इशारा करते हैं। मैक्वेरी में यूएस एआई और सॉफ्टवेयर रिसर्च के प्रमुख फ्रेड हैवमेयर ने कहा कि सोरा का लॉन्च उद्योग के लिए एक बड़ा कदम है।
हैवमेयर ने कहा, “न केवल आप लंबे वीडियो बना सकते हैं, मैं 60 सेकंड तक समझता हूं, बल्कि जो वीडियो बनाए जाते हैं वे अधिक सामान्य दिखते हैं और वास्तव में भौतिकी और वास्तविक दुनिया का अधिक सम्मान करते हैं।” “आपको वीडियो फ़ीड पर इतने सारे ‘अलौकिक घाटी’ वीडियो या टुकड़े नहीं मिलते जो अप्राकृतिक लगते हों।”
हालांकि पिछले साल एआई-जनरेटेड वीडियो में “भारी प्रगति” हुई है – जिसमें पिछले नवंबर में स्टेबल वीडियो डिफ्यूजन की शुरूआत भी शामिल है – फॉरेस्टर के प्रमुख विश्लेषक रोवन कुरेन ने कहा कि ऐसे वीडियो में पात्रों और दृश्यों की स्थिरता सुनिश्चित करने के लिए अधिक “संपादन” की आवश्यकता होती है।
हालाँकि, सोरा के वीडियो की स्थिरता और लंबाई, “रचनात्मक लोगों के लिए एआई-जनित वीडियो के तत्वों को अधिक पारंपरिक सामग्री में शामिल करने के नए अवसरों का प्रतिनिधित्व करती है, और अब भी एक या कुछ संकेतों से पूर्ण कथा वीडियो तैयार करने के लिए,” कुरेन ने कहा। एसोसिएटेड प्रेस शुक्रवार को ईमेल द्वारा।
संभावित जोखिम क्या हैं? हालाँकि गुरुवार को लॉन्च होने के बाद से सोरा की क्षमताओं ने पर्यवेक्षकों को स्तब्ध कर दिया है, लेकिन एआई-जनित वीडियो के उपयोग के नैतिक और सामाजिक प्रभावों के बारे में चिंता भी बनी हुई है।
उदाहरण के लिए, हैवमेयर संभावित रूप से व्यस्त 2024 चुनाव चक्र से जुड़े महत्वपूर्ण जोखिमों पर प्रकाश डालता है। उन्होंने कहा, यथार्थवादी दिखने वाले वीडियो बनाने का “संभावित जादुई” तरीका राजनीति और उससे परे कई समस्याएं पैदा करता है। उन्होंने समस्याओं पर प्रकाश डाला धोखाधड़ी, प्रचार और दुष्प्रचार।
हैवमेयर ने कहा, “जेनरेटिव एआई की नकारात्मक बाहरीताएं 2024 में बहस का एक महत्वपूर्ण विषय होंगी।” “यह एक महत्वपूर्ण मुद्दा है जिसका इस वर्ष प्रत्येक व्यवसाय और प्रत्येक व्यक्ति को सामना करना पड़ेगा।”
जब एआई और इसके जोखिमों को नियंत्रित करने की बात आती है तो टेक कंपनियां आगे रहती हैं, क्योंकि दुनिया भर की सरकारें इसे पकड़ने के लिए संघर्ष कर रही हैं। दिसंबर में, यूरोपीय संघ दुनिया के पहले व्यापक एआई नियमों पर समझौते पर पहुंचा, लेकिन अंतिम मंजूरी के दो साल बाद तक कानून लागू नहीं होगा।
गुरुवार को, OpenAI ने कहा कि वह सोरा को व्यापक रूप से उपलब्ध कराने से पहले महत्वपूर्ण सुरक्षा उपाय कर रहा था।
कंपनी ने लिखा, “हम रेड टीमों के साथ काम कर रहे हैं – गलत सूचना, घृणास्पद सामग्री और पूर्वाग्रह जैसे क्षेत्रों के विशेषज्ञ – जो प्रतिकूल तरीकों से मॉडल का परीक्षण करेंगे।” “हम भ्रामक सामग्री का पता लगाने में मदद करने के लिए उपकरण भी विकसित कर रहे हैं, जैसे कि एक डिटेक्शन क्लासिफायरियर जो यह निर्धारित कर सकता है कि सोरा द्वारा कोई वीडियो कब तैयार किया गया था।”
ओपनएआई के वैश्विक मामलों के उपाध्यक्ष अन्ना मकांजू ने शुक्रवार को म्यूनिख सुरक्षा सम्मेलन में इसे दोहराया, जहां ओपनएआई और 19 अन्य प्रौद्योगिकी कंपनियों ने चुनाव-जनित डीपफेक का मुकाबला करने के लिए स्वेच्छा से एक साथ काम करने की प्रतिज्ञा की। एआई द्वारा। उन्होंने कहा कि कंपनी सोरा को “काफ़ी सावधानीपूर्वक तरीके से” रिहा कर रही थी।
उसी समय, ओपनएआई ने सोरा का निर्माण कैसे किया गया, इसके बारे में सीमित जानकारी का खुलासा किया। ओपनएआई की तकनीकी रिपोर्ट से यह पता नहीं चला कि सोरा को प्रशिक्षित करने के लिए किस छवि और वीडियो स्रोतों का उपयोग किया गया था – और कंपनी ने शुक्रवार को आगे की टिप्पणी के अनुरोध का तुरंत जवाब नहीं दिया।
सोरा की रिहाई कुछ लेखकों द्वारा ओपनएआई और उसके बिजनेस पार्टनर माइक्रोसॉफ्ट के खिलाफ मुकदमों और चैटजीपीटी बनाने के लिए लेखन के कॉपीराइट कार्यों के उपयोग के लिए न्यूयॉर्क टाइम्स के मुकदमों के बीच भी हुई है। ओपनएआई अपने टेक्स्ट समाचार संग्रह को लाइसेंस देने के लिए एपी को एक अज्ञात शुल्क का भुगतान करता है।