Нови модели на AI от Alibaba победиха GPT-4o по математика
Alibaba стартира група от математически фокусирани големи езикови модели (LLM), наречени Qwen2-Math, които „превъзхождат GPT-4o и Claude 3.5“ в тази област.
Днес пускаме нова серия модели за специфични за математиката езикови модели, Qwen2-Math, която е базирана на Qwen2. Водещият модел, Qwen2-Math-72B-Instruct, превъзхожда патентованите модели, включително GPT-4o и Claude 3.5, в задачи, свързани с математика надолу по веригата!
Чувствайте се свободни да проверите нашия блог… pic.twitter.com/9P4BiBweFY
— Qwen (@Alibaba_Qwen) 8 август 2024 г
„През изминалата година положихме много усилия в изследването и разширяването на възможностите за разсъждение на големите езикови модели, със специален фокус върху способността им да решават аритметични и математически проблеми,“ отбеляза Екипът на Qwen, част от отдела за облачни изчисления на Alibaba.
Моделите Qwen2-Math са базирани на Qwen2 LLMs, представени през юни. Говори се, че водещият Qwen2-Math-72B-Instruct е надминал американските конкуренти по математика, включително GPT-4o на OpenAI, Claude 3.5 Sonnet на Anthropic, Gemini 1.5 Pro на Google и Llama-3.1-405B на Meta Platforms.
В началото на август подразделението за изкуствен интелект на Google DeepMind пусна експериментална версия на своя водещ модел с изкуствен интелект Gemini 1.5 Pro, който привлече общественото внимание поради високите резултати от тестовете.
„Надяваме се, че Qwen2-Math може да допринесе за научната общност чрез решаване на сложни математически проблеми, които изискват многоетапно логическо разсъждение“, отбелязват разработчиците.
Според предоставената информация, новите AI модели на Alibaba са тествани върху математически задачи на английски и китайски. Те включват:
- GSM8K е набор от данни от ~8000 задачи за ученици от началните и средните училища;
- OlympiadBench – задачи от високо ниво, които изискват абстрактно мислене, логика и математически познания;
- GaoKao е националният приемен изпит в китайския университет и се смята за един от най-трудните в света.
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)
Според екипа новите AI модели имат някои ограничения, защото поддържат само английски. Предвижда се в близко бъдеще да се издават двуезични LLM, а по-късно и многоезични.
Да припомним, че през август стана известно, че Alibaba работи върху генератора на изображения Tora.
Преди това технологичният гигант обяви пускането на чатбот с изкуствен интелект Tongyi Qianwen.
Открихте грешка в текста? Изберете го и натиснете CTRL+ENTER
Программы для Windows, мобильные приложения, игры - ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале - Подписывайтесь:)