关键词 "编码" 的搜索结果, 共 24 条, 只显示前 480 条
RelightVid是上海 AI Lab、复旦大学、上海交通大学、浙江大学、斯坦福大学和香港中文大学推出用在视频重照明的时序一致性扩散模型,支持根据文本提示、背景视频或HDR环境贴图对输入视频进行细粒度和一致的场景编辑,支持全场景重照明和前景保留重照明。模型基于自定义的增强管道生成高质量的视频重照明数据对,结合真实视频和3D渲染数据,在预训练的图像照明编辑扩散框架(IC-Light)基础上,插入可
Kilo Code 是开源的VS Code AI Agent扩展程序,提升开发人员的编码效率。具备强大的代码生成能力,能根据自然语言描述快速生成代码片段,有效减少手动编写代码的时间。Kilo Code 能自动化执行多种重复性编码任务,例如代码格式化、重构以及生成样板代码等,进一步提高开发效率。内置最新的AI模型,如Claude和 Gemini 2.5 Pro,无需用户手动配置API密钥,提供MCP
LLaDA-V是中国人民大学高瓴人工智能学院、蚂蚁集团推出的多模态大语言模型(MLLM),基于纯扩散模型架构,专注于视觉指令微调。模型在LLaDA的基础上,引入视觉编码器和MLP连接器,将视觉特征映射到语言嵌入空间,实现有效的多模态对齐。LLaDA-V在多模态理解方面达到最新水平,超越现有的混合自回归-扩散和纯扩散模型。 LLaDA-V的主要功能 图像描述生成:根据输入的图像生成详细的描述
Slidev 是开源的PPT制作模型,基于 Markdown + Vue 技术栈实现。工具支持用简单的 Markdown 语法创建幻灯片,支持代码高亮、实时编码演示、数学公式渲染、图表生成等功能,提供丰富的主题和样式选项。Slidev 提供快速启动命令 npm init slidev,支持在线编辑器 sli.dev/new,无需安装软件简单易用。Slidev 的核心优势在于开发友好性和强大的交互性
# 核心亮点 支持最强开源模型千问3,其代码能力达到业界领先水平,同时支持MCP协议,具备强大的工具调用能力,可以帮助开发者快速开发智能体应用。 全面集成通义灵码智能编码助手(即通义灵码插件)的能力,无需安装插件开箱即用,直接体验高效、智能的编程体验。 自带编程智能体模式,开发者只需描述编码任务,通义灵码便可以自主地进行工程感知、代码检索、执行终端、调用MCP工具等,
Qwen3 Reranker是阿里巴巴通义千问团队发布的文本重排序模型,属于Qwen3模型家族。采用单塔交叉编码器架构,输入文本对后输出相关性得分。模型通过多阶段训练范式,基于高质量标注数据和大量合成训练对进行训练,支持超过100种语言,涵盖主流自然语言及多种编程语言。性能表现上,Qwen3 Reranker-8B在MTEB排行榜上取得了72.94的高分,Qwen3 Reranker-0.6B也已
SmolVLA 是 Hugging Face 开源的轻量级视觉-语言-行动(VLA)模型,专为经济高效的机器人设计。拥有4.5亿参数,模型小巧,可在CPU上运行,单个消费级GPU即可训练,能在MacBook上部署。SmolVLA 完全基于开源数据集训练,数据集标签为“lerobot”。 SmolVLA的主要功能 多模态输入处理:SmolVLA 能处理多种输入,包括多幅图像、语言指令以及
MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token激活 459 亿参数。模型超过国内的闭源模型,接近海外的最领先模型,具有业内最高的性价比。MiniMax-M1原生支持 100 万token的上下文长度,提供40 和80K两种推理预算版本,适合处理长输入
北大团队通过对GPT-4o-Image的深入实验,突破性发现其在视觉特征提取环节中,相较于传统变分自编码器(VAE),更依赖语义编码器进行处理。这一关键洞察为统一模型架构设计开辟了全新路径。 基于上述研究成果,团队推出UniWorld-V1统一生成框架。该框架创新性融合高分辨率对比语义编码器与多模态大模型,仅需2.7M训练样本,即可实现图像理解、生成、编辑、感知等多任务处理。 实验数据显示,在
PageAI 是专为专业人士设计的 AI 网站生成器,能将简单的文字描述快速转化为功能完备、设计精美的网站。用户无需编写代码,只需输入需求描述,PageAI 可通过强大的 AI 模型,自动完成从规划、设计到编码的全过程,生成响应式、SEO 优化的网站代码,支持一键部署。提供丰富的定制选项,如主题、字体和布局调整,内置了博客系统、网站地图、RSS 订阅、暗色模式等多种实用功能,满足不同用户的需求。P
Comate 是百度推出的一款智能编码助手,它利基于「文心大模型」,结合百度积累多年的编程现场大数据和外部优秀开源数据,打造的新一代编码辅助工具。拥有代码智能、场景丰富、创造价值、广泛应用等多重产品优势,可实现“帮你想、帮你写、帮你改”的场景应用形态。提升编码效率,释放“十倍”软件生产力。 核心功能 1.代码生成 如前所述,Comate 能够在我们暂停编码时,根据我们的代码上下文,智能补全代
1. VarDrug 引入了一个机器学习框架,用于预测基因变异如何影响药物反应,重点关注精神类药物。它使用来自 PharmGKB 的数据来解决变异体-药物相互作用问题,并比基于规则的方法取得了显著的性能提升。 2. 其核心是一个自监督变异编码器,该编码器基于 100,000 个人类基因组变异体进行训练,并使用 DNABERT2 嵌入对每个变异体的基因组背景进行编码。将此变异编码器添加到标准机器学
1.PRO-LDM 引入了一种模块化潜在扩散模型,用于全长蛋白质序列设计,该模型兼具无条件生成和功能优化,将准确性与计算效率完美结合。 2. 一项重大创新在于在潜在空间中应用扩散,显著降低采样成本,同时保持生成序列的保真度和多样性。 3. PRO-LDM 通过将条件潜在扩散与监督适应度预测相结合,实现了具有目标特性(例如荧光、溶解度、热/化学稳定性)的蛋白质序列的可控设计。 4. 通过无分类
1.codonGPT引入了第一个直接在编码mRNA序列(密码子)上训练的生成语言模型,解决了基于RNA的序列建模中一个主要问题,该问题一直落后于DNA和蛋白质建模的进展。 2.一项关键创新是使用推理时间同义逻辑掩蔽,确保生成的密码子序列以100%的保真度保留原始氨基酸序列,这对于治疗应用至关重要。 3.强化学习(RL)首次在codonGPT的基础上用于优化特定蛋白质的密码子序列。这允许用户跨
Kiro是一款Agentic IDE——简单来说,它不仅是一个AI编码助手,更是一个帮你从灵感到上线、从混乱到清晰的开发搭档。 它不仅擅长“Vibe Coding”,更强大之处在于:它能将这些原型,推进到真正可上线的系统。而这一切,都依赖于两个核心能力:Specs(Specification)和Hooks(自动化触发器)。 vide coding和spec-driven develo
RoboBrain 2.0 是强大的开源具身大脑模型,能统一感知、推理和规划,支持复杂任务的执行。RoboBrain 2.0 包含 7B(轻量级)和 32B(全规模)两个版本,基于异构架构,融合视觉编码器和语言模型,支持多图像、长视频和高分辨率视觉输入,及复杂任务指令和场景图。模型在空间理解、时间建模和长链推理方面表现出色,适用机器人操作、导航和多智能体协作等任务,助力具身智能从实验室走向真实场景
v0.app 是 Vercel 推出 AI 辅助 Web 开发工具。工具结合生成式 AI 和现代 Web 技术,能帮助用户快速构建从简单组件到全栈应用的各种项目。工具引入 AI Agent模式,具备自主规划、编码和调试能力,能根据用户需求生成完整的应用。用户用自然语言描述需求,v0 能生成代码、设计界面并提供技术支持。工具支持实时协作、代码编辑和一键部署,适合产品经理、营销人员和工程师等各类用户,
Sim 是开源的 AI Agent 工作流构建工具。Sim通过轻量级、拖拽式的 Figma 风格界面,让开发者无需复杂编码能快速构建和部署 AI 工作流。Sim 支持主流的大型语言模型(LLM)和多种工具(如 Slack、GitHub 等)的无缝集成,能自动化执行任务,如代码审查、客户支持、数据分析等。Sim 支持实时协作和模块化设计,适合团队共享编辑和适配多种业务场景。Sim的主要功能拖拽式工作
Orchids 是全球首款具备全栈开发能力的 AI 工具,能实现从前端到后端的全流程开发。工具在 UI 设计和全栈开发性能上表现卓越,超越多个主流竞品,如 Lovable、Bolt、v0 等。用户无需依赖外部服务,能构建原型、设计 UI 模型,生成完整应用程序与网站。Orchids 的出现,有望推动开发者更专注于创意实现,减少重复性编码工作,为全栈开发领域带来新的变革。Orchids的主要功能全栈
Neovate Code 是蚂蚁集团开源的智能编程助手,专注于提升开发效率。工具能深度理解代码库,遵循既有编码习惯,精准完成代码生成、Bug修复和重构等任务。通过对话式界面,支持开发者用自然地描述需求,Neovate Code 提供安全、可控的实现方案。工具支持多种流行模型(如 OpenAI、Anthropic 等),可通过插件系统灵活扩展功能。目前以 CLI 工具形式提供,未来将适配更多客户端形
LatticeWorld 是一个开创性的多模态 3D 世界生成框架,由网易、香港城市大学、北京航空航天大学、清华大学等机构共同推出。它将大语言模型与工业级 3D 渲染引擎 Unreal Engine 5(UE5)相结合,能通过简单的文本描述和视觉指令,快速生成具备高动态环境、真实物理仿真和实时渲染的大规模交互式 3D 世界。与传统手工创作相比,LatticeWorld 的效率提升超过 90 倍,且
Giga AI 是一款应用构建工具,助您打造应用,开启自己的事业。Giga Memory:Giga 记住您的决策和偏好,AI 不会犯同样的错误两次Giga Context:管理所有集成的上下文,确保 AI 不会混淆或产生幻觉Giga Planner:引导并帮助您规划应用和最小可行产品(MVP)Giga Build:为初次开发者打造的 Vibe 编码界面
lynx 是由字节跳动研发的高保真个性化视频生成模型,仅需输入一张人像照片,即可生成身份高度一致的动态视频。该模型基于扩散 transformer(dit)架构构建,并创新性地引入了 id-adapter 和 ref-adapter 两个轻量级适配模块,分别用于精准控制人物身份和精细保留面部细节。lynx 配备专用人脸编码器提取面部特征,结合 x-nemo 技术增强表情表现力,通过 lbm 算法模
Traycer 是先进的 AI 编程助手,专注于通过规范驱动开发(Spec-Driven Development)帮助开发者高效规划和实现代码任务。Traycer 通过将开发意图转化为详细的工作规范,将任务分解为多个阶段,让编码Agent(如 Cursor、Claude Code 等)根据规范执行任务,同时验证生成的代码,确保符合规范。Traycer 支持任务规划、代码审查、GitHub 集成等多
只显示前20页数据,更多请搜索
Showing 49 to 72 of 72 results