टेक्नोलॉजी

Openai GPT-4O में छवि पीढ़ी जोड़ता है, लेकिन मुफ्त टियर को इंतजार करना होगा

Openai ने मंगलवार को अपने मौजूदा GPT-4O आर्टिफिशियल इंटेलिजेंस (AI) मॉडल में छवि पीढ़ी की क्षमता को जोड़ा। सैन फ्रांसिस्को स्थित एआई फर्म ने 4O इमेज जेनरेशन मॉडल जारी किया और इसे GPT-4O में एकीकृत किया। कंपनी ने कहा कि इस छवि जनरेटर का ध्यान सजावट के बजाय उपयोगिता पर है। यह सटीक पाठ प्रतिपादन, उच्च शीघ्र पालन, चरित्र स्थिरता के साथ आता है, और यह पाठ संकेतों के माध्यम से छवि संपादन क्षमता प्रदान करता है। Openai ने DEEPFAKES के जोखिम और हानिकारक सामग्री की पीढ़ी को कम करने के लिए कई कदम उठाए हैं।

CHATGPT को बढ़ी हुई छवि उत्पादन क्षमता मिलती है

इस नए जोड़ से पहले भी, CHATGPT Dall-E मॉडल में से एक द्वारा संचालित छवियों को उत्पन्न कर सकता है। हालांकि, यह एक बुनियादी छवि-पीढ़ी का अनुभव था जहां चरित्र स्थिरता और पाठ पीढ़ी उप-बराबर थे। एक ब्लॉग पोस्ट में, कंपनी ने समझाया कि वह अब भाषा मॉडल की प्राथमिक क्षमता के रूप में छवि-जनरेशन फ़ंक्शन को जोड़ने का इरादा रखती है।

GPT-4O का उपयोग करके उत्पन्न छवि
फोटो क्रेडिट: Openai

इसका मतलब यह है कि कंपनी के बड़े भाषा मॉडल (एलएलएम) अब स्वाभाविक रूप से छवियों को उत्पन्न करने और उत्पन्न आउटपुट के लिए संपादन करने में सक्षम होंगे। इन मॉडलों के बड़े पैरामीटर आकार और प्रशिक्षण के बाद के प्रयासों के कारण, ये मॉडल उपयोगकर्ता के संकेतों के पीछे के संदर्भ को समझने के लिए अच्छी तरह से अनुकूल हैं, जो वे खोज रहे हैं। इसके अलावा, चूंकि ये भाषा मॉडल हैं, वे बेहतर प्रक्रिया और पाठ को सही ढंग से प्रस्तुत कर सकते हैं।

नई छवि जनरेटर को ऑनलाइन छवियों और पाठ के संयुक्त वितरण पर प्रशिक्षित किया गया था। Openai का दावा है कि मॉडल समझता है कि कैसे चित्र भाषा से संबंधित हैं और कैसे छवियां अन्य छवियों से संबंधित हैं। नतीजतन, यह अब संवर्धित चरित्र स्थिरता के साथ आता है, और उपयोगकर्ता एक ही चरित्र के साथ कई छवियों को बहुत पीछे-पीछे के बिना उत्पन्न कर सकते हैं।

Chatgpt img3 chatgpt छवि पीढ़ी

GPT 4O का उपयोग करके उत्पन्न पाठ के साथ छवियां
फोटो क्रेडिट: Openai/Derya Unatmaz और Les Morgan

इसके अतिरिक्त, यह सटीक पाठ की एक बड़ी मात्रा के साथ छवियों को भी उत्पन्न कर सकता है। इसका मतलब यह है कि यह साइनबोर्ड, रेस्तरां मेनू और एक व्हाइटबोर्ड पर लिखे गए पाठ के साथ छवियों को सटीक रूप से उत्पन्न कर सकता है। उपयोगकर्ता इनपुट के रूप में एक छवि भी साझा कर सकते हैं, और चैटबॉट इसे विभिन्न शैलियों में फिर से बना सकता है और इसके लिए संपादन कर सकता है।

CHATGPT नवीनतम छवि जनरेटर के साथ बहु-टर्न पीढ़ी भी प्रदान करेगा। उपयोगकर्ता एआई चैटबॉट को संकेतों के साथ एक उत्पन्न छवि में परिवर्तन और परिवर्धन करने के लिए कह पाएंगे, और यह अन्य तत्वों को बदले बिना आउटपुट को परिष्कृत कर सकता है। Openai ने दावा किया कि मॉडल एक ही छवि में 10-20 विभिन्न वस्तुओं को संभाल सकता है और इन तत्वों को सटीक रूप से जोड़ सकता है।

Chatgpt img2 Chatgpt छवि पीढ़ी

GPT-4O का उपयोग करके उत्पन्न फोटोरिअलिस्टिक छवि
फोटो क्रेडिट: Openai

ये सुविधाएँ वर्तमान में CHATGPT प्लस, टीम और प्रो सब्सक्राइबर्स के लिए उपलब्ध हैं। हालांकि यह शुरू में फ्री टियर के लिए भी उपलब्ध था, ओपनईएआई के सीईओ सैम अल्टमैन ने एक्स पर एक पोस्ट में कहा था (पूर्व में ट्विटर के रूप में जाना जाता था) कि उच्च अनुरोध की मात्रा के कारण, फ्री टियर के लिए रोलआउट अनिश्चित काल तक देरी हो रही है।

विशेष रूप से, कई उपयोगकर्ताओं ने GPT-4O का उपयोग करके उत्पन्न अपनी छवियों और लोकप्रिय मेमों के Ghibli- स्टाइल वाले मनोरंजन को साझा करने के लिए सोशल मीडिया प्लेटफार्मों पर ले जाया है। Altman ने X पर अपनी प्रोफाइल पिक्चर को भी अपनी छवि के एक ghibli- शैली के प्रतिपादन में बदल दिया। Ghibli भी सामाजिक मंच पर विश्व स्तर पर ट्रेंड कर रहा था।

सुरक्षा के लिए आ रहा है, Openai सामग्री सिद्धता और प्रामाणिकता (C2PA) जानकारी के लिए गठबंधन को सभी AI- जनित छवियों के मेटाडेटा में जोड़ रहा है ताकि वे आसानी से प्रामाणिक छवियों से अलग हो सकें। एआई फर्म ने एक आंतरिक खोज उपकरण भी बनाया है जो यह सत्यापित कर सकता है कि क्या कंपनी के मॉडल द्वारा एक छवि उत्पन्न की गई थी।

इसके अलावा, कंपनी उन छवियों के लिए अनुरोध करती है जिनमें हानिकारक सामग्री जैसे बाल यौन शोषण सामग्री और यौन डीपफेक शामिल हैं। इसके अतिरिक्त, जब उपयोगकर्ता वास्तविक लोगों की छवियों को संपादित कर रहे होते हैं, तो कंपनी ने उस तरह की कल्पना में प्रतिबंध जोड़े हैं जिन्हें बनाया जा सकता है।

Related Articles

Back to top button