关键词 "Token" 的搜索结果, 共 14 条, 只显示前 480 条
小红书hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源文本大模型 dots.llm1。 dots.llm1是一个中等规模的Mixture of Experts (MoE)文本大模型,在较小激活量下取得了不错的效果。该模型充分融合了团队在数据处理和模型训练效率方面的技术积累,并借鉴了社区关于 MoE 的最新开源成果。hi lab团队开源了所有模型和必要的训练
上海人工智能实验室、复旦、上交大等开源的一款自动撰写综述论文的AI工具:SurveyForge 实验结果,SurveyForge的大纲质量接近人工撰写水平,在参考文献质量、大纲质量和内容质量方面优于AutoSurvey等现有方法 生成约64k token的综述成本不到0.5美元,耗时约10分钟 SurveyForge分为两个阶段: 1、生成大纲,通过分析人工撰写的综述文章的大纲结构和参考领域相
MiniMax-M1是MiniMax团队最新推出的开源推理模型,基于混合专家架构(MoE)与闪电注意力机制(lightning attention)相结合,总参数量达 4560 亿,每个token激活 459 亿参数。模型超过国内的闭源模型,接近海外的最领先模型,具有业内最高的性价比。MiniMax-M1原生支持 100 万token的上下文长度,提供40 和80K两种推理预算版本,适合处理长输入
Agnes AI 是基于 AI 的新一代协作办公平台,能彻底改变传统办公模式。Agnes AI用团队记忆、智能协作和一体化内容生成,打造适配团队场景的工作空间。用户能多人实时编辑文档、报告或 PPT,AI 能自动完成资料收集、大纲生成、内容填充等任务。Agnes AI 自研 7B 推理模型和多智能体推理框架,专注于团队协作场景,支持长上下文和多轮推理,大幅降低 Token 成本,提升任务完成率。A
Mistral AI,最新发布了首个开源语音模型:Voxtral语音理解模型系列! 该模型包含24B和3B两个参数规模的版本,均基于Apache 2.0许可证开源,同时提供API服务接口。 Voxtral模型支持32k token的上下文窗口,能够处理长达30分钟的音频转录任务或40分钟的语义理解任务,在各项基准测试指标上全面超越目前主流的开源语音转录模型Whisper large-v3。
Seed Diffusion是字节跳动Seed团队推出的实验性扩散语言模型,专注于代码生成任务。模型通过两阶段扩散训练、约束顺序学习和强化高效并行解码等关键技术,实现显著的推理加速。模型的推理速度达到2146 tokens/s,比同等规模的自回归模型快5.4倍,在多个代码基准测试中表现与自回归模型相当,在代码编辑任务上超越自回归模型。Seed Diffusion展示了离散扩散模型作为下一代生成模型
LandPPT 是AI演示文稿生成平台,能将文档内容快速转换为专业的 PPT 演示文稿。LandPPT支持 OpenAI、Claude、Gemini 等多种 AI 模型,兼容 PDF、Word、Markdown 等文件格式,支持智能解析内容,生成结构清晰的大纲和精美的 PPT 页面。平台提供丰富的模板系统和自定义功能,用户基于现代化的 Web 界面进行可视化编辑、实时预览和多格式导出。LandPP
Glass 是Pickle 团队推出的开源隐形 AI 桌面助手。Glass能在后台实时捕捉屏幕内容和音频,将其转化为结构化知识。Glass核心功能包括实时会议记录、自动摘要生成、上下文理解及实时问答。Glass 的设计真正隐形,不会出现在屏幕录制、截图或 Dock 中,完全不干扰用户操作。Glass支持 macOS 和 Windows 系统,用户能免费使用,且无需注册。Glass开源特性成为 AI
Baichuan-M2在HealthBench上得到60.1的高分,以32B的较小尺寸不仅反超OpenAI 最新开源模型gpt-oss120b(得分57.6),更是力压Qwen3-235B、Deepseek R1、Kimi K2等当前世界所有开源大模型。 针对医疗领域用户隐私考虑下的模型私有化部署需求,我们对Baichuan-M2进行了极致轻量化,量化后的模型精度接近无损,可以在RTX409
TokenPony 是为个人开发者和小型团队设计的高效 AI 平台,如同一位智能指挥家,将多种主流大模型(如 DeepSeek、Kimi、Qwen、GLM 等)集成在一个统一接口下,极大地简化了模型切换的繁琐流程。用户无需跨平台操作,可一键接入并自由调用不同模型,享受超长 1024K 上下文支持,轻松处理长文档和复杂任务。TokenPony 提供零配置、免部署的一键调用 API,无需自建 GPU
阿里巴巴正式发布其医疗大模型QuarkMed,它在一项模拟中国执业医师资格考试的测试中,取得了70%的惊人准确率,性能超越一众顶尖模型。其成功的秘诀并非单一技术突破,而是一套严谨的组合拳:世界级的数据工程 (1T tokens的权威分级数据) 与独创的“四段式”训练心法,系统性地将通用AI锻造成领域专家。更重要的是,该项目为行业揭示了两条关于AI可靠性的黄金法则:• 法则一:在高风险领域,RAG(
CWM(Code World Model)是 Meta 开源的一个拥有 320 亿参数的代码语言模型。它率先将“世界模型”的概念引入代码生成领域,让模型能够通过模拟代码执行过程,更深层次地理解和生成代码,而不仅仅是基于模式匹配。CWM 在多项基准测试中表现出色,例如在 Math-500 数据集上取得了 96.6% 的准确率。该模型的权重已公开,旨在推动代码生成和理解领域的研究,并帮助开发者更高效地
Qianfan-VL 是百度智能云千帆专为企业级多模态应用场景打造的视觉理解大模型。它提供 3B、8B 和 70B 三种尺寸,不仅具备出色的通用能力,还针对 OCR、教育等垂直领域进行了专项强化。该模型基于开源模型,并在百度自研的昆仑芯 P800 上完成了全流程计算任务,展现出卓越的性能和效率。核心功能多尺寸模型:提供从轻量级到大规模的三种版本,满足不同企业和开发者的需求,适用于各种场景,从端上实
Rocket.new 是一款革命性的 AI 编程平台,专注于帮助用户快速构建和部署全功能的 Web 和移动应用。您只需用简单的提示描述您的需求,Rocket.new 就能自动生成完整的应用,包括后端集成、数据库架构、API 端点和高质量代码。该平台的核心优势在于其深度集成和高效自动化能力,它能进行市场研究、优化用户体验,并提供高质量模板,帮助您快速启动项目。Rocket.new 的用户群体遍布美国
只显示前20页数据,更多请搜索
Showing 97 to 110 of 110 results