Cat de mult te poti baza pe A.I.? partea a doua

Am scris recent un articol în care mă întrebam cât de mult ne putem baza pe ajutorul oferit de A.I.-urile din prezent și am ajuns la concluzia că fiecare platformă ce oferă acest tip de serviciu are lacune și cel mai important este cât s-a invesit în el pentru a fi capabil să aducă informații corecte și actuale.
Acum avem o altă probleamă: cât de logic „gândesc” aceste A.I.-uri pentru ca noi să ne bazăm pe rezultatele oferite și cât de corecte sunt acestea?

Iată un exercițiu simplu de nivel de învățământ primar.

Am făcut un exercițiu simplu de comparație a doua numere aparent apropiate ca valori.

Hai sa vedem fiecare răspuns și apoi să analizăm fiecare punct.

CONCLUZIA

Avem de-a face cu diferite modele de „AI” care sunt LLM-uri și nu reala inteligență artificială, adică nu „gândesc” logic și autonom.

Acum cel mai important este care dintre aceste modele este mai eficient într-o speță.

Avem răspunsuri corecte și răspunsuri greșite. O parte din cele corecte sunt prin inducție logică parțial corectă, altă parte pe cale logică corectă.

ChatGPT inițial a răspuns greșit, apoi probabil a mai căutat informații și a mai dat un răspuns în care rezultatul era corect dar logica după care a dat răspunsul a fost eronat.

DeepSeek a dat din prima răspunsul corect după logica corectă.

Gemini a dat un răspuns corect dar lociga a fost greșită.

Claude a dat un răspuns corect după logica corectă.

Ca un sfat, dacă mi se permite, eu le-aș folosi pe toate și aș face comparații între răspunsurile generate. Pe de altă parte, am lucrat pe parte de scriere cod PHP și din toate, ChatGPT a fost cel mai eficient.
Cel mai probabil, voi reveni cu o a treia parte despre acest subiect dar și pe ajutorul în a rezolva o temă pentru școală și voi mai implica și alte platforme A.I.