关键词 "Universal Vision Transformer (U-ViT)" 的搜索结果, 共 24 条, 只显示前 480 条
国产 Magi-1,在物理真实性上,断层第一,能够无限制生成长视频。 它采用的是一种叫做 chunk-by-chunk 的自回归生成 方法。视频被划分为一个个时间片段(chunk),每段比如 24 帧,相当于 1 秒的视频。 每生成一段,才会进入下一段。下一段的内容,要基于上一段的内容来生成。Magi-1 的结构不是从 Diffusion Transformer 拿过来直接用,而是在 atten
sand.ai是清华大学曹越教授团队创立的视频生成AI平台,目前刚刚开源了全球首个自回归扩散视频生成模型 Magi-1 ,生成长视频效果在行业领先。 马尔奖、清华特奖得主曹越的创业公司 Sand AI 推出了自己的视频生成大模型 ——MAGI-1,该模型权重和代码完全开源,支持无限生成,能将生成时长精确控制到每一秒,在基准测试中更是吊打 Sora,领先了 5 倍。
MAI-DS-R1 是 DeepSeek-R1 推理模型,经过微软 AI 团队的后期训练,提高了其对受阻主题的响应能力和风险状况,同时保持了其推理能力和竞争性能。基于 DeepSeek-R1,这是一种基于 Transformer 的自回归语言模型,利用多头自注意力和混合专家 (MoE) 进行可扩展和高效的推理。 MAI-DS-R1 是一个 DeepSeek-R1 推理模型,经过微软 AI 团
腾讯混元大模型旗下最新发布的Hunyuan3D-2.0系列开源模型,迎来了五款产品(Turbo、Pro、Standard、Lite、Vision)的全系列开源,构建起完整的工具链体系,标志着中国大模型技术首次在多模态领域实现完整开源布局。从30秒生成高精度3D资产的开源框架,到覆盖文本、图像、视频的全模态开源体系,腾讯混元大模型正以开放姿态引领一场全球范围内的数字创作革命。 这一突破得益于腾讯自
QwQ 是 Qwen 系列的推理模型。与传统的指令调优模型相比,QwQ 具备思考和推理能力,在下游任务,尤其是难题中能够取得显著的性能提升。QwQ-32B 是中型推理模型,其性能足以匹敌 DeepSeek-R1、o1-mini 等最先进的推理模型。 QwQ基于Qwen2.5开发,其代码已集成到最新的Hugging界面中transformers,建议您使用最新版本的transformers。 Q
Supervity AI 提供一套旨在提升业务效率的智能体。该平台作为公司知识的中心枢纽,根据内部文档提供精准的答案。智能体可以连接上千种不同的软件应用程序,管理涉及多个步骤的工作流程,从而实现现有业务系统的自动化。 用户无需编写代码即可构建自动化流程。名为“协同浏览 AI”的功能可实时指导员工使用软件,同时另一位智能体可以安全自然地处理客户对话。Vision AI 智能代理通过查看图像和视
phi-4是一个最先进的开放模型,它基于合成数据集、来自筛选过的公共领域网站的数据以及获取的学术书籍和问答数据集构建而成。该方法的目标是确保小型模型能够使用专注于高质量和高级推理的数据进行训练。该模型 phi-4经过了严格的增强和校准过程,结合了监督微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。 14B 参数,密集解码器专用 Transformer 模型 我们的模型旨在加速语
MCP Server for Wayland
OpenCV MCP Server provides OpenCV's image and video processing capabilities through the Model Context Protocol (MCP). Access powerful computer vision tools for tasks ranging from basic image manipulat
MCP Server for Groundlight
🚀 OpenClient- The CLI-Based Universal AI Application Connector! An open-source Model Context Protocol (MCP) implementation that turbocharges LLMs by context provisioning standardization. Quickly conne
Universal-Robots MCP-Server
Universal Test Automation MCP Server with self-healing capabilities and Smithery.ai integration
Servidor MCP para PHP Universal - integra PHP com o protocolo Model Context Protocol
Um servidor MCP universal para desenvolvimento PHP em qualquer provedor de hospedagem ou nuvem
The definitive Vibe Coder's sanity check MCP server: Prevent cascading errors in AI workflows by implementing strategic pattern interrupts. Uses tool call "Vibe Check" with LearnLM 1.5 Pro (Gemini API
A GUI Agent application based on UI-TARS(Vision-Language Model) that allows you to control your computer using natural language.
A universal RPC layer for AI agents. Connect to any function, any language, across network boundaries. AgentRPC wraps your functions in a universal RPC interface, connecting them to a hosted server
Universal database MCP server connecting to MySQL, PostgreSQL, Oracle, SQL Server, MariaDB, SQLite.
A Model Context Protocol server for AI vision analysis using Gemini Vision API
Hosts the Azure-Ai-Vision-Face Liveness Mcp-Server
The UVL Analyzer MCP is a Model Context Protocol (MCP) server designed to analyze feature models written in the Universal Variability Language (UVL). It provides a variety of tools to process and extr
只显示前20页数据,更多请搜索
Showing 193 to 216 of 251 results