Ce model AI crezi că a câștigat concursul mondial de matematică?

Dacă cele mai avansate modele AI din lume s-ar așeza împreună să dea un test de matematică, te-ai aștepta ca GPT-4o sau Claude 3.5 Sonnet să obțină cea mai bună notă. În schimb, un student modest — Qwen2-Math de la Alibaba — i-a surprins pe șefii de promoție, obținând cel mai mare punctaj.

Versiunea de 72 de miliarde de parametri a Qwen2-Math, dezvoltată de gigantul chinez de comerț electronic, a obținut un scor de 84% pe benchmark-ul MATH, care testează modelele de limbaj mare (LLM) pe 12.500 de probleme de matematică la nivel de competiție. Alibaba spune că modelul său depășește modelele LLM de ultimă generație, inclusiv cel mai recent model Llama de la Meta.

Qwen2-Math dovedește că modelele LLM internaționale devin mai sofisticate, mai ales când vine vorba de sarcini specializate. Acest lucru înseamnă că companiile din SUA trebuie acum să depășească nu doar rivalii lor din Silicon Valley, ci și startup-urile AI emergente la nivel mondial.

Alte inovații recente în domeniul AI din străinătate:
– Cercetătorii de la Universitatea Tsinghua din Beijing au dezvoltat primul cip AI din lume alimentat complet de lumină; se spune că este de peste 1.000 de ori mai eficient decât GPU-ul H100, liderul industriei de la Nvidia.
– LG tocmai a lansat Exaone 3.0, primul model open-source din Coreea de Sud; acesta include procesare a limbajului natural, pe care startup-urile o pot folosi pentru a dezvolta propriile platforme de asistență virtuală sau servicii pentru clienți, atât în engleză, cât și în coreeană.

Deși aceste progrese sunt impresionante, poate fi încă dificil să accesezi LLM-uri dezvoltate în străinătate: lucruri precum reglementările privind datele și problemele de compatibilitate tehnică pot face ca utilizarea modelelor străine să fie un proces ce consumă multă energie. Pentru a reduce acest decalaj, companii precum Snowflake lucrează la noi instrumente care ajută startup-urile să comute fără probleme între diferite modele — indiferent de țara în care au fost dezvoltate.

Leave a Reply

Your email address will not be published.

Acest site folosește Akismet pentru a reduce spamul. Află cum sunt procesate datele comentariilor tale.