Un model AI rezolvă probleme la nivel de aur la Olimpiada de Matematică

Compania chineză DeepSeek a lansat DeepSeekMath-V2, un model de raționament matematic care a reușit ceva remarcabil chiar și în standardele domeniului: a obținut rezultate echivalente cu medalia de aur la Olimpiada Internațională de Matematică (IMO) și la Olimpiada Chineză de Matematică (CMO). Mai mult, a obținut 118 puncte din 120 la examenul Putnam, unul dintre cele mai dificile concursuri universitare din lume.

Pentru a înțelege de ce acest rezultat este important, trebuie clarificat un aspect esențial: la olimpiadele de matematică nu contează doar răspunsul final, ci demonstrația completă.

Ce înseamnă o demonstrație olimpică

Problemele de la IMO, CMO și Putnam solicită:

  • soluții originale, nu reproduse după șabloane sau identice cu rezultatele standard;
  • lanțuri de raționament coerente, logic structurate;
  • demonstrații verificate pas cu pas, unde orice greșeală logică invalidează punctajul;
  • creativitate matematică, adică descoperirea unei idei-cheie, nu doar aplicarea unor tehnici de rutină.

De regulă, aceste probleme nu pot fi rezolvate prin memorarea unor formule, ci necesită o înțelegere profundă și o abordare inventivă. În fiecare an, doar câțiva dintre cei mai buni olimpici din lume reușesc să producă demonstrații complete pentru toate problemele.

Faptul că modelul a obținut scoruri la nivel de medalie de aur înseamnă că:

  • a generat soluții care respectă rigoarea matematică cerută olimpiadelor;
  • a produs demonstrații ce pot fi verificate, nu doar răspunsuri;
  • a gestionat probleme care, prin design, cer idei originale.

Performanța de la Putnam – 118 din 120 de puncte – este un indicator suplimentar al capacității sale. Puțini oameni au atins vreodată un scor apropiat de perfecțiune la acest concurs, deoarece problemele sunt extrem de dificile și testate pe mii de studenți talentați.

DeepSeekMath-V2 introduce un mecanism de auto-verificare. Două modele AI lucrează împreună:

  • un „prover”, care generează demonstrația;
  • un „reviewer”, care verifică logic fiecare pas.

Această arhitectură reduce riscul ca modelul să producă o explicație greșită, dar un răspuns final corect. În matematică, acest detaliu este crucial, pentru că evaluarea se bazează pe justificarea completă.

De ce contează aceste rezultate

Matematica este unul dintre domeniile în care competența nu poate fi mimată. O demonstrație necesită:

  • rigoare logică,
  • consistență,
  • încadrare într-un sistem formal,
  • capacitatea de a construi un argument de la zero.

Faptul că un model poate face acest lucru la nivel olimpic indică un progres semnificativ în dezvoltarea AI orientată spre raționament, nu doar generare de text.

Nu înseamnă că modelul „gândește” precum un om, dar arată că sistemele moderne pot reproduce procese sofisticate de deducție pe care, până recent, doar câțiva oameni extrem de talentați le puteau realiza constant.

Distribuie: