Qwen VLo 是通义千问团队推出的多模态统一理解与生成模型。在多模态大模型的基础上进行了全面升级,能“看懂”世界,能基于理解进行高质量的再创造,实现了从感知到生成的跨越。能精准理解图像内容,在此基础上进行一致性和高质量的生成。用户可以通过自然语言指令要求模型对图像进行风格转换、场景重构或细节修饰,模型能灵活响应并生成符合预期的结果。Qwen VLo 支持多语言指令,打破语言壁垒,为全球用户提供便捷的交互体验。具备动态分辨率训练与生成的能力,支持任意分辨率和长宽比的图像生成,适用于多种场景。
- 多模型同台竞技:用户在同一界面选择多个Qwen模型进行对话和任务处理,直观比较不同模型的性能和特点,方便找到最适合特定任务的模型。
- 上传文档,精准问答:支持上传多种格式文档,基于文档内容精准回答问题,极大提高从大量文档中提取特定信息的效率。
- HTML预览:回答内容支持HTML格式展示,包括文字排版、图片插入、链接添加等。
- 看图说话:用户上传图片后,Qwen Chat能理解图片内容并进行描述或回答相关问题,适用于图像识别、内容创作、教育等多领域。
- 类似Artifacts功能:生成代码片段、文件、图表、svg及互动式React组件等人工制品,为开发者和专业人士提供高效的工作支持。