Наука 28.01.2025 15:31 Снимка: ДНЕС+
Следващият ход на Китай: И Alibaba пусна нов AI модел
Изкуственият интелект на Alibaba може да обработва файлове, да разбира видеоклипове и да управлява компютър
Екипът за изкуствен интелект на Alibaba публикува в GitHub новия си модел Qwen2.5-VL. Той може да изпълнява редица задачи, свързани с текстов и визуален анализ. Това се случва малко след като китайският стартъп DeepSeek публикува своя иновативен AI модел, предизвикал срив в акциите на западните технологични гиганти.
Изкуственият интелект на Alibaba може да обработва файлове, да разбира видеоклипове, да преброява обекти в изображения, както и да управлява компютър - подобно на модела, който захранва наскоро представения Operator от OpenAI.
Според тестовете на екипа на Qwen, най-добрият модел от серията Qwen2.5-VL превъзхожда GPT-4o на OpenAI, Claude 3.5 Sonnet на Anthropic и Gemini 2.0 Flash на Google в редица задачи, включително разбиране на видео съдържание, математика, анализ на документи и въпроси-отговори.
Qwen2.5-VL, който е достъпен за тестване в приложението Qwen Chat на Alibaba и за изтегляне от платформата за AI разработка Hugging Face, може да анализира диаграми и графики, да извлича данни от сканирани фактури и формуляри и да "разбира" видеоклипове с продължителност от няколко часа, според екипа.
Qwen2.5-VL също така разпознава "IP адреси от филми и телевизионни сериали, както и широка гама от продукти", което подсказва, че моделите може да са били частично обучавани с помощта на материали със защитени авторски права.
Една от по-интересните функции на Qwen2.5-VL е способността му да взаимодейства със софтуер - както на компютри, така и на мобилни устройства.
Видео, публикувано в X от Филип Шмид, технически ръководител в Hugging Face, показва как Qwen2.5-VL стартира приложението Booking.com за Android и резервира полет от Чунцин до Пекин.
В друго видео моделът Qwen2.5-VL управлява приложения на Linux десктоп, но изглежда не постига много повече от смяна на табовете. Може би показателно е, че според тестовете на Qwen, моделът Qwen2.5-VL се представя слабо на OSWorld - бенчмарк, който имитира реална компютърна среда.
Двата по-малки и по-малко сложни модела от серията Qwen2.5-VL, Qwen2.5-VL-3B и Qwen2.5-VL-7B, са достъпни с отворен лиценз. Водещият модел Qwen2.5-VL-72B обаче е под специален лиценз на Alibaba, който изисква компаниите и разработчиците с повече от 100 милиона месечни активни потребители да получат разрешение от Qwen/Alibaba, преди да използват модела за търговски цели.
Междувременно, DeepSeek публикуваха нови AI модели за изображения, за които се твърди, че изпреварва DALL-E 3 на OpenAI. Любопитното е, че те могат да се ползват за търговски цели без ограничения.
Още по темата
CHF
|
1 | 2.09583 |
GBP
|
1 | 2.22633 |
RON
|
10 | 3.84091 |
TRY
|
100 | 3.90535 |
USD
|
1 | 1.66851 |
Последни новини
- 12:13 В обръщение към нацията Тръмп изтъкна победите си: Наследих бъркотия и сега я оправям
- 12:04 ЕС постигна съгласие за нови правила за депортацията на кандидати за убежище в трети страни
- 11:55 Венецуела поиска заседание на Съвета за сигурност на ООН заради "продължаващата агресия на САЩ"
- 11:47 Сирски тревожен: Русия е събрала 710 000 войници за стратегическа настъпателна операция
- 11:39 Антониу Коща: ЕС няма да принуждава Белгия да приеме използването на замразените руски активи
- 11:32 Манол Генов: Протестите бяха насочени повече към българския парламент и по-малко към правителството
- 11:28 Пеевски се отказва от НСО: Ако цената за спокойна държава са охраната и кабинета ми, аз ще я платя
- 11:23 “Льо Фигаро”: За провалите на ЕС - Фон дер Лайен и Кая Калас да си ходят!