മുൻ മോഡലുകളെ അപേക്ഷിച്ച് കൂടുതൽ കൃത്യതയും മെച്ചപ്പെട്ട നിയന്ത്രണവുമാണ് ChatGPT Images 2.0 നൽകുന്നതെന്ന് ഓപ്പൺഎഐ വ്യക്തമാക്കുന്നു.
Photo Credit: OpenAI
ChatGPT, Codex എന്നിവയിലെ എല്ലാ ഉപയോക്താക്കൾക്കും ഇന്ന് മുതൽ ChatGPT Images 2.0 ലഭ്യമായിത്തുടങ്ങി.
ഓപ്പൺഎഐയുടെ ഇമേജ് ജനറേഷൻ മോഡലിന്റെ പുതിയ പതിപ്പായ ChatGPT Images 2.0 ചൊവ്വാഴ്ച പുറത്തിറക്കി. ഉപയോക്താക്കൾ നൽകുന്ന നിർദ്ദേശങ്ങൾക്കനുസരിച്ച് കൂടുതൽ കൃത്യവും വ്യക്തവുമായ ചിത്രങ്ങൾ സൃഷ്ടിക്കാൻ ഈ പുതിയ മോഡലിന് സാധിക്കുമെന്ന് കമ്പനി അവകാശപ്പെടുന്നു. ഇൻസ്ട്രക്ഷൻ ഫോളോവിംഗ്, മൾട്ടി ലിംഗുൽ റെൻഡറിംഗ്, ചിത്രങ്ങളുടെ ഘടന എന്നിവയിൽ വലിയ മെച്ചപ്പെടുത്തലുകളാണ് വരുത്തിയിരിക്കുന്നത്. സങ്കീർണ്ണമായ ജോലികൾക്കായി മികച്ച റീസണിംഗ് ശേഷിയും ഇതിൽ ഉൾപ്പെടുത്തിയിട്ടുണ്ട്. നിലവിൽ ChatGPT, Codex, API എന്നിവയിൽ ഈ സേവനം ലഭ്യമാണ്.
ChatGPT Images 2.0 ചൊവ്വാഴ്ച മുതൽ ChatGPT, Codex എന്നിവയിലെ എല്ലാ ഉപയോക്താക്കൾക്കും ലഭ്യമാണെന്ന് ഓപ്പൺഎഐ അറിയിച്ചു. റീസണിംഗ് ശേഷിയുള്ള തിങ്കിംഗ് ഫീച്ചറുകൾ ഉൾപ്പെടെയുള്ള അത്യാധുനിക സൗകര്യങ്ങൾ ChatGPT Plus, Pro, Business വരിക്കാർക്ക് മാത്രമായിരിക്കും ലഭ്യമാകുക.
ഡെവലപ്പർമാർക്ക് gpt-image-2 API വഴി ഈ മോഡൽ ഉപയോഗിക്കാൻ സാധിക്കും. എന്നിരുന്നാലും, തിരഞ്ഞെടുക്കുന്ന ചിത്രത്തിന്റെ ഗുണനിലവാരത്തിനും റെസല്യൂഷനും അനുസരിച്ച് ഇതിന്റെ നിരക്കുകളിൽ മാറ്റമുണ്ടാകും. പുതിയ മോഡൽ 2K റെസല്യൂഷൻ വരെയുള്ള ചിത്രങ്ങൾ പിന്തുണയ്ക്കുമെന്ന് കമ്പനി അവകാശപ്പെടുന്നുണ്ടെങ്കിലും, ഉയർന്ന റെസല്യൂഷൻ ഔട്ട്പുട്ടുകൾ നിലവിൽ ബീറ്റാ ഘട്ടത്തിലാണ്.
മുൻ മോഡലുകളെ അപേക്ഷിച്ച് മികച്ച നിയന്ത്രണവും കൃത്യതയുമാണ് പുതിയ ChatGPT Images 2.0 നൽകുന്നതെന്ന് ഓപ്പൺഎഐ വ്യക്തമാക്കുന്നു. ഉപയോക്താക്കൾ നൽകുന്ന വിശദമായ നിർദ്ദേശങ്ങൾക്കനുസരിച്ച് കൃത്യമായ ചിത്രങ്ങൾ രൂപപ്പെടുത്താൻ ഇതിലൂടെ സാധിക്കും. മുൻപ് എഐ ഇമേജ് ജനറേറ്ററുകൾക്ക് പ്രയാസകരമായിരുന്ന സങ്കീർണ്ണമായ യുഐ ഘടകങ്ങൾ, സാന്ദ്രമായ ടെക്സ്റ്റുകൾ, ലേഔട്ടുകൾ എന്നിവ ഉൾപ്പെടുന്ന ചിത്രങ്ങൾ നിർമ്മിക്കാൻ ഈ മോഡലിന് പ്രത്യേക ശേഷിയുണ്ട്.
ഭാഷാപരമായ പിന്തുണയിലാണ് മറ്റൊരു ശ്രദ്ധേയമായ മാറ്റം. ഇംഗ്ലീഷിന് പുറമെ ഹിന്ദി, ബംഗാളി, ചൈനീസ്, ജാപ്പനീസ്, കൊറിയൻ തുടങ്ങിയ ഭാഷകൾ കൂടുതൽ കൃത്യമായി ചിത്രങ്ങളിൽ ഉൾപ്പെടുത്താൻ പുതിയ പതിപ്പിന് കഴിയും. ഇതിലൂടെ പോസ്റ്ററുകൾ, ഡയഗ്രമുകൾ, ഇൻഫോഗ്രാഫിക്സ് എന്നിവ പ്രാദേശിക ഭാഷകളിൽ തന്നെ തയ്യാറാക്കാം.
ഫോട്ടോറിയലിസ്റ്റിക് ചിത്രങ്ങൾ, സിനിമാറ്റിക് വിഷ്വലുകൾ, പിക്സൽ ആർട്ട്, മാംഗ തുടങ്ങിയ വിവിധ ശൈലികളിൽ ഒരുപോലെ മികച്ച ഗുണനിലവാരം ഉറപ്പാക്കാൻ പുതിയ മോഡലിനാകും. ലൈറ്റിംഗ്, ടെക്സ്ചർ എന്നിവയിൽ വലിയ പുരോഗതി വരുത്തിയതിനൊപ്പം, അൾട്രാ വൈഡ് (3:1) മുതൽ ടോൾ ലേഔട്ട് (1:3) വരെയുള്ള വിവിധ ആസ്പെക്ട് റേഷ്യോകളും ഇത് പിന്തുണയ്ക്കുന്നു.
ChatGPT Images 2.0 പതിപ്പിലൂടെ 'തിങ്കിംഗ്' (thinking) ശേഷിയും ഓപ്പൺഎഐ അവതരിപ്പിച്ചു. സങ്കീർണ്ണമായ കാര്യങ്ങൾ വിശകലനം ചെയ്യാനും കൂടുതൽ മികച്ച രീതിയിൽ ജോലികൾ പൂർത്തിയാക്കാനും ഈ പുതിയ ഫീച്ചർ സഹായിക്കുന്നു. റീസണിംഗ് ശേഷിയുള്ള ചാറ്റ്ജിപിടി മോഡലുമായി ചേർന്ന് പ്രവർത്തിക്കുന്നതിനാൽ, ഇന്റർനെറ്റിൽ നിന്ന് തത്സമയ വിവരങ്ങൾ തേടാനും അവ വിശകലനം ചെയ്ത് കൃത്യതയുള്ള ചിത്രങ്ങൾ നിർമ്മിക്കാനും ഒരൊറ്റ പ്രോംപ്റ്റിലൂടെ സാധിക്കും. 2025 ഡിസംബർ വരെയുള്ള വിവരങ്ങളാണ് ഈ മോഡലിൽ അപ്ഡേറ്റ് ചെയ്തിരിക്കുന്നത്.
ഒരേസമയം എട്ട് ചിത്രങ്ങൾ വരെ ഒരേ നിലവാരത്തിൽ സൃഷ്ടിക്കാൻ പുതിയ മോഡലിന് സാധിക്കുമെന്ന് ഓപ്പൺഎഐ അവകാശപ്പെടുന്നു. ഇതിലൂടെ ചിത്രങ്ങളിലെ കഥാപാത്രങ്ങൾ, വസ്തുക്കൾ എന്നിവയിലെല്ലാം കൃത്യമായ തുടർച്ച ഉറപ്പാക്കാം. ഡിസൈൻ പ്രോട്ടോടൈപ്പിംഗ്, മാർക്കറ്റിംഗ്, വിദ്യാഭ്യാസം, ഉൽപ്പന്ന വികസനം തുടങ്ങിയ വിവിധ മേഖലകളിൽ ഇത് ഏറെ ഉപകാരപ്രദമാണ്. വിവരങ്ങൾ ദൃശ്യരൂപത്തിലാക്കാനും ലളിതമായ ലേഔട്ടുകളിൽ അവതരിപ്പിക്കാനും ഈ പുതിയ എഐ മോഡലിന് പ്രത്യേക കഴിവുണ്ട്.
ChatGPT Images 2.0 വലിയൊരു മുന്നേറ്റമാണെങ്കിലും ഇതിന് ചില പരിമിതികളുണ്ടെന്ന് ഓപ്പൺഎഐ ചൂണ്ടിക്കാട്ടുന്നു. സങ്കീർണ്ണമായ പസിലുകൾ, ഒറിഗാമി നിർദ്ദേശങ്ങൾ, അസാധാരണ ആംഗിളുകളിൽ നിന്നുള്ള വസ്തുക്കളുടെ ദൃശ്യങ്ങൾ തുടങ്ങി ഭൗതികമായ ധാരണ കൃത്യമായി വേണ്ടിവരുന്ന കാര്യങ്ങളിൽ ഈ മോഡൽ ഇപ്പോഴും വെല്ലുവിളി നേരിടുന്നുണ്ട്.
അതുപോലെ തന്നെ, അതിസങ്കീർണ്ണമോ ആവർത്തനസ്വഭാവമുള്ളതോ ആയ ദൃശ്യങ്ങൾ ഒരുക്കുന്നതിലും പ്രയാസങ്ങൾ കണ്ടേക്കാം. ഡയഗ്രമുകൾ, ലേബലുകളുള്ള ചിത്രങ്ങൾ എന്നിവയുടെ കൃത്യത ഉറപ്പാക്കാൻ ചിലപ്പോൾ നേരിട്ടുള്ള പരിശോധന ആവശ്യമായി വരും. 2K-ക്ക് മുകളിലുള്ള ഉയർന്ന റെസല്യൂഷൻ ചിത്രങ്ങൾ നിലവിൽ ബീറ്റാ ഘട്ടത്തിലായതിനാൽ അവയുടെ ഗുണനിലവാരത്തിൽ എല്ലായ്പ്പോഴും സ്ഥിരത ഉണ്ടായെന്നു വരില്ല.
പരസ്യം
പരസ്യം
WhatsApp Launches Prepaid Mobile Recharges for Users in India: How to Recharge Your Mobile Number