Openai GPT-4O में छवि पीढ़ी जोड़ता है, लेकिन मुफ्त टियर को इंतजार करना होगा

Openai ने मंगलवार को अपने मौजूदा GPT-4O आर्टिफिशियल इंटेलिजेंस (AI) मॉडल में छवि पीढ़ी की क्षमता को जोड़ा। सैन फ्रांसिस्को स्थित एआई फर्म ने 4O इमेज जेनरेशन मॉडल जारी किया और इसे GPT-4O में एकीकृत किया। कंपनी ने कहा कि इस छवि जनरेटर का ध्यान सजावट के बजाय उपयोगिता पर है। यह सटीक पाठ प्रतिपादन, उच्च शीघ्र पालन, चरित्र स्थिरता के साथ आता है, और यह पाठ संकेतों के माध्यम से छवि संपादन क्षमता प्रदान करता है। Openai ने DEEPFAKES के जोखिम और हानिकारक सामग्री की पीढ़ी को कम करने के लिए कई कदम उठाए हैं।
CHATGPT को बढ़ी हुई छवि उत्पादन क्षमता मिलती है
इस नए जोड़ से पहले भी, CHATGPT Dall-E मॉडल में से एक द्वारा संचालित छवियों को उत्पन्न कर सकता है। हालांकि, यह एक बुनियादी छवि-पीढ़ी का अनुभव था जहां चरित्र स्थिरता और पाठ पीढ़ी उप-बराबर थे। एक ब्लॉग पोस्ट में, कंपनी ने समझाया कि वह अब भाषा मॉडल की प्राथमिक क्षमता के रूप में छवि-जनरेशन फ़ंक्शन को जोड़ने का इरादा रखती है।
GPT-4O का उपयोग करके उत्पन्न छवि
फोटो क्रेडिट: Openai
इसका मतलब यह है कि कंपनी के बड़े भाषा मॉडल (एलएलएम) अब स्वाभाविक रूप से छवियों को उत्पन्न करने और उत्पन्न आउटपुट के लिए संपादन करने में सक्षम होंगे। इन मॉडलों के बड़े पैरामीटर आकार और प्रशिक्षण के बाद के प्रयासों के कारण, ये मॉडल उपयोगकर्ता के संकेतों के पीछे के संदर्भ को समझने के लिए अच्छी तरह से अनुकूल हैं, जो वे खोज रहे हैं। इसके अलावा, चूंकि ये भाषा मॉडल हैं, वे बेहतर प्रक्रिया और पाठ को सही ढंग से प्रस्तुत कर सकते हैं।
नई छवि जनरेटर को ऑनलाइन छवियों और पाठ के संयुक्त वितरण पर प्रशिक्षित किया गया था। Openai का दावा है कि मॉडल समझता है कि कैसे चित्र भाषा से संबंधित हैं और कैसे छवियां अन्य छवियों से संबंधित हैं। नतीजतन, यह अब संवर्धित चरित्र स्थिरता के साथ आता है, और उपयोगकर्ता एक ही चरित्र के साथ कई छवियों को बहुत पीछे-पीछे के बिना उत्पन्न कर सकते हैं।
GPT 4O का उपयोग करके उत्पन्न पाठ के साथ छवियां
फोटो क्रेडिट: Openai/Derya Unatmaz और Les Morgan
इसके अतिरिक्त, यह सटीक पाठ की एक बड़ी मात्रा के साथ छवियों को भी उत्पन्न कर सकता है। इसका मतलब यह है कि यह साइनबोर्ड, रेस्तरां मेनू और एक व्हाइटबोर्ड पर लिखे गए पाठ के साथ छवियों को सटीक रूप से उत्पन्न कर सकता है। उपयोगकर्ता इनपुट के रूप में एक छवि भी साझा कर सकते हैं, और चैटबॉट इसे विभिन्न शैलियों में फिर से बना सकता है और इसके लिए संपादन कर सकता है।
CHATGPT नवीनतम छवि जनरेटर के साथ बहु-टर्न पीढ़ी भी प्रदान करेगा। उपयोगकर्ता एआई चैटबॉट को संकेतों के साथ एक उत्पन्न छवि में परिवर्तन और परिवर्धन करने के लिए कह पाएंगे, और यह अन्य तत्वों को बदले बिना आउटपुट को परिष्कृत कर सकता है। Openai ने दावा किया कि मॉडल एक ही छवि में 10-20 विभिन्न वस्तुओं को संभाल सकता है और इन तत्वों को सटीक रूप से जोड़ सकता है।
GPT-4O का उपयोग करके उत्पन्न फोटोरिअलिस्टिक छवि
फोटो क्रेडिट: Openai
ये सुविधाएँ वर्तमान में CHATGPT प्लस, टीम और प्रो सब्सक्राइबर्स के लिए उपलब्ध हैं। हालांकि यह शुरू में फ्री टियर के लिए भी उपलब्ध था, ओपनईएआई के सीईओ सैम अल्टमैन ने एक्स पर एक पोस्ट में कहा था (पूर्व में ट्विटर के रूप में जाना जाता था) कि उच्च अनुरोध की मात्रा के कारण, फ्री टियर के लिए रोलआउट अनिश्चित काल तक देरी हो रही है।
विशेष रूप से, कई उपयोगकर्ताओं ने GPT-4O का उपयोग करके उत्पन्न अपनी छवियों और लोकप्रिय मेमों के Ghibli- स्टाइल वाले मनोरंजन को साझा करने के लिए सोशल मीडिया प्लेटफार्मों पर ले जाया है। Altman ने X पर अपनी प्रोफाइल पिक्चर को भी अपनी छवि के एक ghibli- शैली के प्रतिपादन में बदल दिया। Ghibli भी सामाजिक मंच पर विश्व स्तर पर ट्रेंड कर रहा था।
सुरक्षा के लिए आ रहा है, Openai सामग्री सिद्धता और प्रामाणिकता (C2PA) जानकारी के लिए गठबंधन को सभी AI- जनित छवियों के मेटाडेटा में जोड़ रहा है ताकि वे आसानी से प्रामाणिक छवियों से अलग हो सकें। एआई फर्म ने एक आंतरिक खोज उपकरण भी बनाया है जो यह सत्यापित कर सकता है कि क्या कंपनी के मॉडल द्वारा एक छवि उत्पन्न की गई थी।
इसके अलावा, कंपनी उन छवियों के लिए अनुरोध करती है जिनमें हानिकारक सामग्री जैसे बाल यौन शोषण सामग्री और यौन डीपफेक शामिल हैं। इसके अतिरिक्त, जब उपयोगकर्ता वास्तविक लोगों की छवियों को संपादित कर रहे होते हैं, तो कंपनी ने उस तरह की कल्पना में प्रतिबंध जोड़े हैं जिन्हें बनाया जा सकता है।