ഓപ്പൺഎഐ ഒടുവിൽ ഏറെ പ്രതീക്ഷയോടെ കാത്തിരുന്ന ജിപിടി അപ്‌ഡേറ്റ് ജിപിടി-4 അവതരിപ്പിച്ചു. ലോകമെമ്പാടുമുള്ള ഉപയോക്താക്കളെ ഇതിനകം വിസ്മയിപ്പിച്ച ചില ശക്തമായ പുതിയ ഫീച്ചറുകളും കഴിവുകളുമായാണ് ലാർജ് ലാംഗ്വേജ് മോഡൽ (LLM) വരുന്നത്.

GPT-3.5-നേക്കാൾ മികച്ചതായിരിക്കുന്നതിനു പുറമേ, OpenAI-യുടെ വൈറൽ ചാറ്റ്‌ബോട്ട് ChatGPT-യെ പവർ ചെയ്യുന്ന നിലവിലുള്ള LLM, GPT-4-ന് കൂടുതൽ സങ്കീർണ്ണമായ ഇൻപുട്ട് മനസ്സിലാക്കാൻ കഴിയും, വലിയ പ്രതീക ഇൻപുട്ട് ശ്രേണിയുണ്ട്, മൾട്ടിമോഡൽ കഴിവുകളുണ്ട്, കൂടാതെ ഉപയോഗിക്കാൻ സുരക്ഷിതവുമാണ്.

1. GPT-4 ന് കൂടുതൽ സങ്കീർണ്ണമായ ഇൻപുട്ടുകൾ മനസ്സിലാക്കാൻ കഴിയും

GPT-4-ന്റെ ഏറ്റവും വലിയ പുതിയ സവിശേഷതകളിലൊന്ന് കൂടുതൽ സങ്കീർണ്ണവും സൂക്ഷ്മവുമായ സിഗ്നലുകൾ മനസ്സിലാക്കാനുള്ള കഴിവാണ്. OpenAI പ്രകാരം, GPT-4 “വ്യത്യസ്ത പ്രൊഫഷണൽ, അക്കാദമിക് മാനദണ്ഡങ്ങളിൽ മാനുഷിക നിലവാരത്തിലുള്ള പ്രകടനം പ്രകടമാക്കുന്നു.”

GPT-4 നിരവധി മാനുഷിക-തല പരീക്ഷകളിലൂടെയും പ്രത്യേക പരിശീലനമൊന്നുമില്ലാതെ SAT, BAR, GRE പോലുള്ള സ്റ്റാൻഡേർഡ് ടെസ്റ്റുകളിലൂടെയും ഇത് പ്രകടമാക്കി. ബോർഡിലുടനീളം താരതമ്യേന ഉയർന്ന സ്‌കോറുകളുള്ള ഈ ടെസ്റ്റുകൾ GTP-4 മനസ്സിലാക്കുകയും ഏസ് ചെയ്യുകയും മാത്രമല്ല, ഓരോ തവണയും അതിന്റെ മുൻഗാമിയായ GPT-3.5 നെ മറികടക്കുകയും ചെയ്തു.

കൂടുതൽ സൂക്ഷ്മമായ ഇൻപുട്ട് സിഗ്നലുകൾ മനസ്സിലാക്കാനുള്ള കഴിവ്, GPT-4 ന് വളരെ വലിയ പദപരിധി ഉണ്ട് എന്ന വസ്തുതയും സഹായിക്കുന്നു. പുതിയ മോഡലിന് 25,000 വാക്കുകൾ വരെ ഇൻപുട്ട് പ്രതീകങ്ങൾ കൈകാര്യം ചെയ്യാൻ കഴിയും (റഫറൻസിനായി, GPT-3.5 8,000 വാക്കുകളായി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു). ഉപയോക്താക്കൾക്ക് അവരുടെ സിഗ്നലുകളിലേക്ക് കടത്തിവിടാൻ കഴിയുന്ന വിശദാംശങ്ങളുടെ അളവിനെ ഇത് നേരിട്ട് ബാധിക്കും, അതിനാൽ മോഡലിന് പ്രവർത്തിക്കാൻ കൂടുതൽ വിവരങ്ങൾ ലഭിക്കുകയും ദൈർഘ്യമേറിയ ഔട്ട്പുട്ടുകൾ നിർമ്മിക്കുകയും ചെയ്യുന്നു.

GPT-4 ലാത്വിയൻ, വെൽഷ്, സ്വാഹിലി തുടങ്ങിയ ലോ-റിസോഴ്സ് ഭാഷകൾ ഉൾപ്പെടെ 26-ലധികം ഭാഷകളെ പിന്തുണയ്ക്കുന്നു. MMLU ബെഞ്ച്മാർക്കിൽ ത്രീ-ഷോട്ട് കൃത്യതയോടെ ബെഞ്ച്മാർക്ക് ചെയ്തപ്പോൾ, GPT-4 GPT-3.5-നെയും കൂടാതെ 24 ഭാഷകളിലുടനീളമുള്ള ഇംഗ്ലീഷ് ഭാഷാ പ്രകടനത്തിന്റെ കാര്യത്തിൽ PalM, Chinchilla പോലുള്ള മറ്റ് മുൻനിര LLM-കളെയും മറികടന്നു.

2. മൾട്ടിമോഡൽ കഴിവുകൾ

ChatGPT-യുടെ മുൻ പതിപ്പ് ടെക്‌സ്‌റ്റ് പ്രോംപ്റ്റുകൾക്ക് മാത്രമായി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. ഇതിനു വിപരീതമായി, GPT-4 ന്റെ ഏറ്റവും പുതിയ സവിശേഷതകളിലൊന്ന് അതിന്റെ മൾട്ടിമോഡൽ കഴിവുകളാണ്. മോഡലിന് ടെക്സ്റ്റ്, ഇമേജ് സിഗ്നലുകൾ സ്വീകരിക്കാൻ കഴിയും.

ഇതിനർത്ഥം, AI-ക്ക് ഒരു ഇമേജ് ഒരു ഇൻപുട്ടായി സ്വീകരിക്കാനും ഒരു ടെക്സ്റ്റ് പ്രോംപ്റ്റിന്റെ അതേ രീതിയിൽ അതിനെ വ്യാഖ്യാനിക്കാനും മനസ്സിലാക്കാനും കഴിയും. ഈ കഴിവ് എല്ലാ വലുപ്പത്തിലും തരത്തിലും ചിത്രങ്ങളിലേക്കും ടെക്‌സ്‌റ്റുകളിലേക്കും വ്യാപിക്കുന്നു, രണ്ട് കോൾട്ടഡ് ഡോക്യുമെന്റുകൾ, കൈകൊണ്ട് വരച്ച ഡ്രോയിംഗുകൾ, സ്‌ക്രീൻഷോട്ടുകൾ പോലും.

എന്നിരുന്നാലും, GPT-4 ന്റെ ഇമേജ് റീഡിംഗ് കഴിവുകൾ അവയെ വ്യാഖ്യാനിക്കുന്നതിനും അപ്പുറമാണ്. OpenAI ഇത് അവരുടെ ഡെവലപ്പർ സ്ട്രീമിൽ (മുകളിൽ) ഡെമോ ചെയ്തു, അവിടെ അവർ GPT-4 ന് ഒരു തമാശ വെബ്‌സൈറ്റിന്റെ കൈകൊണ്ട് വരച്ച മോക്കപ്പ് നൽകി. മോക്കപ്പുകൾ ഒരു വെബ്‌സൈറ്റാക്കി മാറ്റുന്നതിന് HTML, JavaScript കോഡ് എഴുതാൻ മോഡലുകളെ ചുമതലപ്പെടുത്തി, തമാശകൾ യഥാർത്ഥമായവ ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിച്ചു.

മോക്കപ്പിൽ വ്യക്തമാക്കിയ ലേഔട്ട് ഉപയോഗിച്ച് GPT-4 കോഡ് എഴുതി. പരിശോധനയിൽ, നിങ്ങൾ ഊഹിക്കുന്നതുപോലെ, യഥാർത്ഥ തമാശകൾ അടങ്ങിയ ഒരു വർക്കിംഗ് സൈറ്റ് കോഡ് നിർമ്മിച്ചു. AI യുടെ പുരോഗതി പ്രോഗ്രാമിംഗിന്റെ അവസാനത്തെ അർത്ഥമാക്കുമെന്നാണോ ഇതിനർത്ഥം? കൃത്യമായി അല്ല, പക്ഷേ പ്രോഗ്രാമർമാരെ സഹായിക്കുന്നതിന് ഇത് ഇപ്പോഴും ഉപയോഗപ്രദമാകുന്ന ഒരു സവിശേഷതയാണ്.

ഈ സവിശേഷത പ്രതീക്ഷ നൽകുന്നതുപോലെ, ഇത് ഇപ്പോഴും ഗവേഷണ പ്രിവ്യൂവിലാണ്, മാത്രമല്ല പൊതുവായി ലഭ്യമല്ല. കൂടാതെ, വിഷ്വൽ ഇൻപുട്ട് പ്രോസസ്സ് ചെയ്യുന്നതിന് മോഡൽ വളരെയധികം സമയമെടുക്കുന്നു, ഓപ്പൺഎഐ തന്നെ പറയുന്നത് വേഗത്തിലാക്കാൻ ജോലിയും സമയവും എടുക്കുമെന്ന്.

3. കൂടുതൽ സ്ഥിരത

GPT-4 ന് ഉയർന്ന സ്ഥിരതയുണ്ടെന്ന് OpenAI അവകാശപ്പെടുന്നു. AI-ക്ക് സ്വഭാവം തകർക്കാൻ ഇത് ബുദ്ധിമുട്ടുണ്ടാക്കുകയും ചെയ്തു, അതായത് ഒരു പ്രത്യേക പ്രതീകം പ്ലേ ചെയ്യാൻ ഒരു ആപ്പിൽ നടപ്പിലാക്കുമ്പോൾ പരാജയപ്പെടാനുള്ള സാധ്യത കുറവാണ്.

“സിസ്റ്റം” സന്ദേശത്തിൽ ദിശ വിവരിച്ചുകൊണ്ട് ഡെവലപ്പർമാർക്ക് അവരുടെ AI-യുടെ ശൈലിയും പ്രവർത്തനവും സജ്ജമാക്കാൻ കഴിയും. ഈ സന്ദേശമയയ്‌ക്കൽ API-കൾ ചില പരിധികൾക്കുള്ളിൽ ഉപയോക്തൃ അനുഭവം വളരെയധികം ഇഷ്ടാനുസൃതമാക്കാൻ ഉപയോക്താക്കളെ അനുവദിക്കുന്നു. ഈ സന്ദേശങ്ങൾ മോഡലിനെ “ജയിൽ ബ്രേക്ക്” ചെയ്യാനുള്ള എളുപ്പവഴിയായതിനാൽ, അവ കൂടുതൽ സുരക്ഷിതമാക്കാനുള്ള ശ്രമത്തിലാണ്. GPT-4-നുള്ള ഡെമോ, GPT-4 ഒരു സോക്രട്ടിക് അദ്ധ്യാപകനാകുന്നതിൽ നിന്നും അവരുടെ ചോദ്യത്തിന് ഉത്തരം നൽകുന്നതിൽ നിന്നും തടയാൻ ശ്രമിച്ചുകൊണ്ട് ഒരു ഉപയോക്താവിലേക്ക് പോയിന്റ് എത്തിച്ചു. എന്നിരുന്നാലും, സ്വഭാവം തകർക്കാൻ മോഡൽ വിസമ്മതിച്ചു.

4. സുരക്ഷ

GPT-4 സുരക്ഷിതവും കൂടുതൽ അനുസരണമുള്ളതുമാക്കാൻ OpenAI ആറുമാസം ചെലവഴിച്ചു. അനുചിതമായതോ അല്ലെങ്കിൽ നിരസിച്ചതോ ആയ ഉള്ളടക്കത്തിനായുള്ള അഭ്യർത്ഥനകളോട് പ്രതികരിക്കാനുള്ള സാധ്യത 82% കുറവാണെന്നും, സെൻസിറ്റീവ് അഭ്യർത്ഥനകൾക്കായി OpenAI-യുടെ നയങ്ങൾക്കനുസൃതമായി പ്രതികരിക്കാനുള്ള സാധ്യത 29% കൂടുതലാണെന്നും GPT-3.5 നേക്കാൾ വസ്തുതാപരമായ പ്രതികരണങ്ങൾ നൽകാനുള്ള സാധ്യത കൂടുതലാണെന്നും കമ്പനി അവകാശപ്പെടുന്നു. 40% സാധ്യത കൂടുതലാണ്.

ഇത് തികഞ്ഞതല്ല, കാലാകാലങ്ങളിൽ അത് “ഭ്രമം” സൃഷ്ടിക്കുമെന്നും അതിന്റെ പ്രവചനങ്ങളിൽ തെറ്റ് സംഭവിക്കുമെന്നും നിങ്ങൾക്ക് പ്രതീക്ഷിക്കാം. തീർച്ചയായും, GPT-4 ന് മികച്ച ധാരണയും പ്രവചന ശക്തിയും ഉണ്ട്, എന്നാൽ നിങ്ങൾ ഇപ്പോഴും AI-യെ അന്ധമായി വിശ്വസിക്കരുത്.

5. പ്രകടനം മെച്ചപ്പെടുത്തുക

മാനുഷിക പരീക്ഷകളിലെ മോഡലിന്റെ പ്രകടനം വിലയിരുത്തുന്നതിന് പുറമേ, മെഷീൻ ലേണിംഗ് മോഡലുകൾക്കായി രൂപകൽപ്പന ചെയ്ത പരമ്പരാഗത മാനദണ്ഡങ്ങളിൽ ബോട്ടിനെ ഓപ്പൺഎഐ വിലയിരുത്തി.

GPT-4 നിലവിലുള്ള LLM-കളെയും “ഏറ്റവും അത്യാധുനിക മോഡലുകളെയും” “ഗണ്യമായി മറികടക്കുന്നു” എന്ന് അത് അവകാശപ്പെടുന്നു. ഈ മാനദണ്ഡങ്ങളിൽ മുകളിലുള്ള MMLU, AI2 റീസണിംഗ് ചലഞ്ച് (ARC), WinoGrande, HumanEval, Drop എന്നിവ ഉൾപ്പെടുന്നു, ഇവയെല്ലാം വ്യക്തിഗതമാണ്.

Leave a Reply

Your email address will not be published. Required fields are marked *