Новый Qwen 3.5-Plus: Open-source ИИ — теперь всё серьезно

Illustration
Qwen 3.5-Plus: «агентский» ИИ с открытым исходным кодом, который упрощает решение сложных задач для разработчиков
Alibaba выпустила Qwen 3.5 и особо выделила Qwen 3.5-Plus как модель, разработанную для агентской работы: планирования, использования инструментов и выполнения многоэтапных задач со значительно более высокой эффективностью. Посыл ясен: меньше «магии промптов», больше надежного исполнения — и всё это с контекстом до 1 млн токенов в версии Plus.
Почему это важно для разработчиков
Если вы создаете продакшн-агентов (RAG, копилоты, боты для автоматического код-ревью, конвейеры данных, UI-тестеры), самая большая проблема не в том, «знает ли модель что-то», а в том: может ли она последовательно выполнять рабочий процесс, не ломаясь на шестом шаге. Qwen 3.5-Plus нацелен именно на эту область — с большим контекстом, мультимодальным вводом и встроенным поведением использования инструментов (tool-use).
Это модель, которая пытается превратить LLM из «чат-интерфейса» в исполнительный слой: она видит, планирует, использует инструменты и завершает работу.— Как Qwen 3.5 позиционирует «агентское» направление
Основные новшества (Qwen 3.5-Plus на практике)
- Контекст 1 млн: на практике это означает, что вы можете загружать большие фрагменты кодовой базы, логи, спецификации и длинные диалоги без постоянного дробления на части (chunking).
- Adaptive tool use: модель обучена самостоятельно решать, когда вызывать инструмент (поиск, выполнение кода, браузер, функции), вместо того чтобы делать всё «в уме».
- Multimodal + «visual agent»: понимает изображения/документы и ориентирован на работу с десктопными и мобильными приложениями (агент, который может «кликать» и выполнять действия).
- Еффективность (MoE / архитектура): упор на более высокую пропускную способность и низкие затраты; Alibaba в публичных выступлениях подчеркивает значительно меньшую стоимость и лучшую масштабируемость рабочих нагрузок.
- Open ecosystem: серия поставляется с версиями open-weight и инструментарием (репозитории, форматы HF), в то время как Plus часто предлагается как хостинговая модель для обеспечения задержки и стабильности на уровне продакшена.
Как быстро попробовать (без лишних слов)
Самый быстрый путь — через провайдера, который уже хостит Qwen 3.5-Plus (например, шлюз/агрегатор или облачную студию). Если у вас уже есть приложение, использующее API в стиле «chat completions», миграция в основном сводится к смене имени модели и проверке лимитов контекста и инструментов.
// Минимальный пример (псевдокод): замените эндпоинт/SDK в зависимости от провайдера
import OpenAI from "openai";
const client = new OpenAI({ apiKey: process.env.API_KEY, baseURL: process.env.BASE_URL });
const res = await client.chat.completions.create({
model: "qwen3.5-plus",
messages: [
{ role: "system", content: "Ты — агент, который выполняет задачи." },
{ role: "user", content: "Просмотри этот репозиторий и предложи 5 улучшений безопасности." }
]
});
console.log(res.choices[0].message.content);
Кейсы, в которых Qwen 3.5-Plus имеет реальное преимущество
- Агентский RAG на больших корпусах: контекст 1 млн + использование инструментов снижают потребность в агрессивной суммаризации.
- Repo-level coding: анализ нескольких файлов + генерация PR с последовательным планом (меньше «случайных правок»).
- Автоматизация UI/QA: мультимодальный ввод + направление «визуального агента» для сквозных тестов и воспроизведения багов по скринкастам/скриншотам.
- Ops/анализ инцидентов: большие объемы логов + выполнение сценариев (runbook) с использованием инструментов (поиск, запросы, тикеты).
- Агент рабочих процессов данных: генерация SQL, валидация результатов, итеративные исправления — всё в одной сессии без потери контекста.
Компромиссы (чтобы не попасть в ловушку хайпа)
- Контекст 1 млн ≠ 1 млн «идеальной памяти»: чем больше входные данные, тем внимательнее нужно следить за структурой (разделение на секции, индекс, план извлечения).
- Агентское поведение требует ограничений (guardrails): обязательно добавьте уровень политик (разрешенные инструменты, лимиты запросов, песочница), логирование и повторное воспроизведение.
- Хостинг против open-weight: Plus как хостинговая модель отлично подходит для низкой задержки и стабильности, но open-weight варианты лучше для приватности и контроля on-prem — при более высокой нагрузке на эксплуатацию (ops).
Итог: Qwen 3.5-Plus — это сигнал о том, что гонка смещается с вопроса «кто умнее в чате» на «кто надежнее выполняет сложные рабочие процессы». Если вы создаете агентов для продакшена, это стоит протестировать — особенно если вашим узким местом являются контекст, использование инструментов и стабильность на протяжении нескольких шагов.