Индикатор загрузки
Загрузка...

Команда Qwen от Alibaba представила ИИ-модели для управления ПК и телефонами

9 VIEWS

Обновлено: 05.02.2025

Опубликовано: 05.02.2025

На этой неделе внимание технологической индустрии в основном приковано к китайской лаборатории ИИ DeepSeek, но её главный местный конкурент, Alibaba, не остаётся в тени.

В понедельник команда Qwen от Alibaba представила новое семейство ИИ-моделей Qwen2.5-VL, которые могут выполнять различные задачи по анализу текста и изображений. Эти модели умеют обрабатывать файлы, анализировать видео, считать объекты на изображениях, а также управлять ПК — подобно модели, которая лежит в основе недавно выпущенной функции Operator от OpenAI.

По данным команды Qwen, лучшая модель Qwen2.5-VL обогнала GPT-4 от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 2.0 Flash от Google по ряду тестов, включая анализ видео, математику, анализ документов и ответ на вопросы.

Модель Qwen2.5-VL, доступная для тестирования в приложении Qwen Chat от Alibaba и для скачивания на платформе для разработчиков AI Hugging Face, может анализировать графики и диаграммы, извлекать данные из сканов счетов и форм, а также «понимать» видео продолжительностью несколько часов, утверждает команда Qwen. Она также способна распознавать персонажей из фильмов и сериалов, а также широкий ассортимент товаров, что предполагает, что модели могли быть частично обучены на защищённых авторским правом материалах.

Однако, как и другие ИИ-системы, разработанные китайскими компаниями, Qwen2.5-VL имеет ограничения на темы, о которых она может говорить — по крайней мере, в Qwen Chat. Когда я попросил крупнейшую и наиболее мощную модель Qwen2.5-VL, Qwen2.5-VL-72B, поговорить о «ошибках Си Цзиньпина», приложение выдало ошибку.

Китайский интернет-регулятор проводит оценку многих местных моделей, чтобы убедиться, что их ответы соответствуют «основным социалистическим ценностям». Поэтому многие китайские ИИ-системы отказываются отвечать на темы, которые могут вызвать недовольство у регуляторов, например, на вопросы о независимости Тайваня.

Одной из более интересных функций Qwen2.5-VL является её способность взаимодействовать с программным обеспечением — как на ПК, так и на мобильных устройствах. В видео, размещенном на платформе X Филиппом Шмидом, техническим лидером Hugging Face, показано, как Qwen2.5-VL запускает приложение Booking.com для Android и бронирует билет на рейс из Чунцина в Пекин.

На видео ниже модель Qwen2.5-VL управляет приложениями на Linux-десктопе, но, похоже, не делает ничего существенного, кроме как переключает вкладки. Возможно, это объясняется тем, что, согласно результатам тестирования Qwen, модель Qwen2.5-VL плохо справляется с OSWorld — тестом, который пытается имитировать реальную компьютерную среду.

Два меньших и менее сложных модели в серии Qwen2.5-VL — Qwen2.5-VL-3B и Qwen2.5-VL-7B — доступны по свободной лицензии. Однако флагманская модель Qwen2.5-VL-72B использует собственную лицензию Alibaba, которая требует от компаний и разработчиков с более чем 100 миллионами активных пользователей в месяц получить разрешение от Qwen/Alibaba перед коммерческим использованием модели.

Интересуетесь нейросетями? Больше полезных материалов в нашем специальном разделе!

YouTube База знаний Профессии TikTok Инструменты MyTarget Арбитраж Яндекс Google Общие темы Конференции Руководства Вконтакте Интервью Instagram Одноклассники Яндекс Директ Google Ads Facebook Кейсы Новости

Автор

TraffNews

0 Comments

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Максимальный размер загружаемого файла: 20 МБ. Вы можете загрузить: изображение, видео. Ссылки на YouTube, Facebook, Twitter и другие сервисы, вставленные в текст комментария, будут автоматически встроены. Перетащите файл сюда

Traffnews рекомендует

Cloaking.house

Cloaking.House — профессиональный клоакинг-сервис для арбитражников. Выясняем, как он помогает обходить модерацию, защищает рекламные кампании и фильтрует трафик. В статье разберем функционал, ограничения, реальные отзывы, инструкцию по настройке и тарифные планы.

TRAFFNEWS

Промокод TRAFFNEWS дает 30% скидку на любой тариф

Скопировано!
Ads Approved

Ads Approved — премиум white сайты с встроенной AI клоакой внутри сайта. Запускайте рекламу без банов.

ASocks

Asocks — сервис, который предлагает мобильные и резидентские прокси из более чем 200 стран Азии, Европы, СНГ, Африки, Латама, Северной Америки. 1. Оплата только за использованный трафик (нет привязки к отдельным прокси или тарифным планам с ограничением по времени); 2. +7м IP адресов, собственная инфраструктура прокси с чистыми адресами; 3. Индивидуальные прокси под любые типы…

TRAFFNEWS3GB

По промокоду TRAFFNEWS3GB вы получаете 3GB трафика

Скопировано!
Партнерки
Показать все
ADLEAD.PRO

ADLEAD.PRO — true бурж мультивертикальная СРА-сеть с 5 000+ офферов по WAP-Click, Mobile content, Sweepstakes, CPI, Nutra, Finance. Мы предлагаем от 250+ локальных рекламодателей, которых нет ни у кого на рынке, в ЛатАм, Азии, Европе, Африке и Северной Америке, приватные капы, высокие ставки и отсутствие лимитов для твоего профита.

подробнее
AdCombo

AdCombo — твой надежный СРА партнер! Почему? За 9 лет на рынке ребята накопили огромную экспертизу в нише. Около 120 000 вебмастеров по всему миру оценили преимущества работы с партнеркой. Команда собрала самые лучшие условия, чтобы каждый мог работать в плюс.

подробнее
BetBoom Partners

BetBoom Partners — партнерская программа международного холдинга BetBoom. Работает под официальными лицензиями в Бразилии, Мексике и Перу.

подробнее

Похожие материалы:

Сколько платит YouTube

Сколько платит YouTube за 1000 и 1 миллион просмотров: реальные цифры

Читать
как зарабатывать на создании мультиков

Как зарабатывать от $50 000 на создании мультиков с ChatGPT для YouTube

Читать
сколько получают OnlyFans модели

Сколько РЕАЛЬНО получают OnlyFans модели: интервью с продюсером моделей OnlyFans

Читать

Alea as Gold Sponsor for iGaming Club Conference Malaga 2025

Читать

AffPapa iGaming Awards 2025: Registration is now open!

Читать

iGaming Club Barcelona 2025 wrapped: our biggest networking event yet!

Читать

По прогнозам, 2025 год станет ещё одним сложным годом для стартапов

Читать

Продолжительность видео в Instagram Reels увеличена до 3 минут

Читать