Нови модели на AI от Alibaba победиха GPT-4o по математика

Alibaba-мин

Alibaba стартира група от математически фокусирани големи езикови модели (LLM), наречени Qwen2-Math, които „превъзхождат GPT-4o и Claude 3.5“ в тази област.

„През изминалата година положихме много усилия в изследването и разширяването на възможностите за разсъждение на големите езикови модели, със специален фокус върху способността им да решават аритметични и математически проблеми,“ отбеляза Екипът на Qwen, част от отдела за облачни изчисления на Alibaba.

Моделите Qwen2-Math са базирани на Qwen2 LLM, представени през юни. Говори се, че водещият Qwen2-Math-72B-Instruct е надминал американските конкуренти по математика, включително GPT-4o на OpenAI, Claude 3.5 Sonnet на Anthropic, Gemini 1.5 Pro на Google и Llama-3.1-405B на Meta Platforms.

Нови модели на AI от Alibaba победиха GPT-4o по математика
Сравнение на Qwen2-Math с други AI модели. данни: Куен.

В началото на август подразделението за изкуствен интелект на Google DeepMind пусна експериментална версия на своя водещ модел с изкуствен интелект Gemini 1.5 Pro, който привлече общественото внимание поради високите резултати от тестовете.

„Надяваме се, че Qwen2-Math може да допринесе за научната общност чрез решаване на сложни математически проблеми, които изискват многоетапно логическо разсъждение“, отбелязват разработчиците.

Според предоставената информация, новите AI модели на Alibaba са тествани върху математически задачи на английски и китайски. Те включват:

  • GSM8K е набор от данни от ~8000 задачи за ученици от началните и средните училища;
  • OlympiadBench – задачи от високо ниво, които изискват абстрактно мислене, логика и математически познания;
  • GaoKao е националният приемен изпит в китайския университет и се смята за един от най-трудните в света.
Нови модели на AI от Alibaba победиха GPT-4o по математика
Сравнение на Qwen2-Math с други AI модели в различни тестове. Данни: Qwen.

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Според екипа новите AI модели имат някои ограничения, защото поддържат само английски. Предвижда се в близко бъдеще да бъдат издадени двуезични LLM, а по-късно и многоезични.

Да припомним, че през август стана известно, че Alibaba работи върху генератора на изображения Tora.

Преди това технологичният гигант обяви пускането на чатбот с изкуствен интелект Tongyi Qianwen.

Открихте грешка в текста? Изберете го и натиснете CTRL+ENTER

Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)

Подобни статии

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *