关键词 "优化" 的搜索结果, 共 24 条, 只显示前 480 条
Tavily是一个为大型语言模型(LLMs)和检索增强生成(RAG)优化的搜索引擎,旨在提供高效、快速且持久的搜索结果。该产品由Tavily团队开发,目标用户是AI开发者、研究人员以及需要实时、准确、有根据的信息的企业。Tavily Search API通过连接LLMs和AI应用程序到可信赖的实时知识,减少了幻觉和整体偏见,帮助AI做出更好的决策。 Tavily的主要功能和特点 Tavily Search API的核心功能包括: 深度研究:通过单一的API调用,简化数据收集,提供来自可信来源的聚合和精选结果。 智能查询建议和答案:装备AI以自动化的方式深化知识,通过细微的答案和后续查询。 多源优化:与Bing、Google和SerpAPI等其他API相比,Tavily Search API会审查多个来源,从每个来源中找到最相关的内容,以优化LLM上下文。 灵活性和成本效益:Tavily Search API提供更灵活的定价计划和更实惠的成本。 如何使用Tavily 要使用Tavily Search API,开发者可以通过Python SDK轻松与API交互,直接在Python程序中利用搜索功能。开发者还可以自定义字段,如上下文等,以优化搜索结果。Tavily的搜索结果基于来源的可信度和内容质量进行索引和排名,并且能够自主地构建后续查询,深入主题以提供细微的答案和全面的分析。 Tavily的适用人群 Tavily Search API适用于AI开发者、研究人员、企业数据分析师以及任何需要集成高效搜索功能的AI应用程序的开发者。特别是那些使用LLMs和RAG技术的用户,将能从Tavily提供的精确和实时的信息检索中受益。 Tavily的价格 Tavily提供不同的定价计划,以满足不同用户的需求: Researcher计划:免费,每月1,000次API调用。 Project计划:$30/月,每月4,000次API调用。 Bootstrap计划:$100/月,每月15,000次API调用。 Startup计划:$220/月,每月38,000次API调用。 Growth计划:$500/月,每月100,000次API调用。 Add-On计划:$100一次性购买,额外8,000次API调用。 Enterprise计划:提供定制API调用、生产就绪的速率限制、定制的主题和来源以及企业级的安全和隐私。 Tavily产品总结 Tavily Search API是一个专门为AI设计的搜索引擎,它通过提供实时、准确和有根据的信息检索,帮助AI应用程序做出更好的决策。其深度研究、智能查询建议和答案以及多源优化等特点,使其在同类产品中脱颖而出。适用于各种规模的开发者和企业,Tavily的灵活定价计划确保了用户可以根据自己的需求选择合适的方案。
AI-DOG是一个基于AI内容创作的平台。
中国科学院深圳先进技术研究院提出的Swin-UMamba进一步推动了图像分割任务中的模型架构优化。与TransUNet不同,Swin-UMamba基于Swin Transformer的层次化特性,通过局部自注意力机制有效捕捉多尺度特征,同时充分利用了在ImageNet上预训练的优势,结合基础模型在自然图像上学到的知识,大幅提升了模型在医疗影像任务中的数据效率和性能,展现了出色的迁移能力。Swin-UMamba能够跨越多种模态(如MRI、内镜图像、显微镜图像等)实现精确分割。
Aignostics公司发布了目前最大规模的腹部CT数据集AbdomenAtlas。该数据集涵盖了广泛的人群特征及多种设备类型,共收录了来自112家医疗机构的20,460例三维CT影像。研究团队由10名放射科医生组成,采用人工智能辅助标注方法,完成了67.3万个高质量解剖结构掩码的标注工作。他们首先对5,246例影像中的22种解剖结构进行人工标注,随后利用半自动化流程,由放射科医生优化模型预测的标注结果。
SPOTlight提供了一个工具,可以从单细胞参考中对细胞混合物进行反卷积。该工具最初是为 10X 的 Visium(空间转录组学)技术开发的,可用于所有输出细胞混合物的技术。它与 Bioconductor 的Single Cell Experiment和Spatial Experiment类以及密集和稀疏矩阵兼容。此外,该软件包还提供可视化工具来评估反卷积的结果。简而言之,SPOTlight它基于通过 NMFreg 模型为每种细胞类型找到主题配置文件签名,然后优化细胞类型比例以拟合我们想要反卷积的混合物。
Baysor 是一款用于对基于成像的空间转录组学数据进行细胞分割的工具。它根据细胞的转录组成、大小和形状的可能性来优化分割。该方法可以考虑细胞核或细胞质染色,也可以仅基于检测到的分子进行分割。
组织病理学图像评估对于癌症诊断和亚型分类至关重要。用于组织病理学图像分析的标准人工智能方法专注于优化针对每个诊断任务的专门模型 。尽管此类方法已取得一些成功,但它们对由不同数字化协议生成的图像或从不同人群采集的样本的普遍性通常有限。在此,为了应对这一挑战,我们设计了临床组织病理学影像评估基础 (CHIEF) 模型,这是一个通用的弱监督机器学习框架,用于提取病理影像特征以进行系统的癌症评估。CHIEF 利用两种互补的预训练方法来提取不同的病理表示:用于图块级特征识别的无监督预训练和用于全切片模式识别的弱监督预训练。我们使用涵盖 19 个解剖部位的 60,530 张全切片图像开发了 CHIEF。 CHIEF 通过在 44 TB 高分辨率病理成像数据集上进行预训练,提取了可用于癌细胞检测、肿瘤起源识别、分子谱表征和预后预测的微观表征。我们使用来自全球 24 家医院和队列的 32 个独立切片集的 19,491 张全切片图像成功验证了 CHIEF。总体而言,CHIEF 的表现比最先进的深度学习方法高出 36.1%,展现了其能够处理在不同人群样本中观察到的领域偏移(domain shift),并采用不同的切片制备方法进行处理。CHIEF 为癌症患者的高效数字病理评估奠定了可推广的基础。
可解释和可调试的知识:图表提供了可查询、可视化和更新的人类可导航的知识视图。 快速、低成本、高效:设计用于大规模运行,无需大量资源或成本要求。 动态数据:自动生成和优化图表以最适合您的领域和本体需求。 增量更新:支持数据演变时的实时更新。 智能探索:利用基于 PageRank 的图形探索来提高准确性和可靠性。 异步和类型化:完全异步,具有完整类型支持,以实现强大且可预测的工作流程。 Fast GraphRAG 旨在无缝融入您的检索管道,为您提供高级 RAG 的强大功能,而无需构建和设计代理工作流程的开销。
skyreels-极速短视频制作软件,智能AI技术,文字转短视频,一键生成小说推文视频,逼真视频.自媒体及个人可以高效快速智能的制作生动有趣的短视频作品,号称能连续生成长视频。 昆仑万维SkyReels团队正式发布并开源SkyReels-V2——全球首个使用扩散强迫(Diffusion-forcing)框架的无限时长电影生成模型,其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。SkyReels-V2现已支持生成30秒、40秒的视频,且具备生成高运动质量、高一致性、高保真视频的能力。
InternVL Family: A Pioneering Open-Source Alternative to GPT-4o. 接近GPT-4o表现的开源多模态对话模型 InternVL 家族:利用开源套件缩小与商业多模态模型的差距——GPT-4o 的先驱开源替代方案 InternVL3,一个性能强大的开源多模态大模型。其中InternVL3-78B同时在感知能力和推理能力上同时达到了开源第一的性能。InternVL3-78B的核心技术包括:可变视觉位置编码,原生多模态预训练,混合偏好优化,以及多模态测试时间缩放。
Wan2.1,这是一套全面开放的视频基础模型,旨在突破视频生成的界限。Wan2.1提供以下主要功能: 👍 SOTA 性能:Wan2.1在多个基准测试中始终优于现有的开源模型和最先进的商业解决方案。 👍支持消费级 GPU:T2V-1.3B 型号仅需 8.19 GB VRAM,兼容几乎所有消费级 GPU。它可在约 4 分钟内在 RTX 4090 上生成一段 5 秒的 480P 视频(无需量化等优化技术)。其性能甚至可与一些闭源型号相媲美。 👍多任务:Wan2.1在文本转视频、图像转视频、视频编辑、文本转图像和视频转音频方面表现出色,推动了视频生成领域的发展。 👍视觉文本生成:Wan2.1是第一个能够生成中文和英文文本的视频模型,具有强大的文本生成功能,可增强其实际应用。 👍强大的视频 VAE:Wan-VAE提供卓越的效率和性能,可对任意长度的 1080P 视频进行编码和解码,同时保留时间信息,使其成为视频和图像生成的理想基础。
腾讯混元大模型旗下最新发布的Hunyuan3D-2.0系列开源模型,迎来了五款产品(Turbo、Pro、Standard、Lite、Vision)的全系列开源,构建起完整的工具链体系,标志着中国大模型技术首次在多模态领域实现完整开源布局。从30秒生成高精度3D资产的开源框架,到覆盖文本、图像、视频的全模态开源体系,腾讯混元大模型正以开放姿态引领一场全球范围内的数字创作革命。 这一突破得益于腾讯自主研发的3D生成加速框架FlashVDM,它打破了传统3D生成模型的效率瓶颈,将大规模3D模型的生成时间压缩至秒级,为开源社区与工业界的应用部署提供了可能。 Hunyuan3D-2.0推出了多种模型版本,以适应不同应用需求。例如,多视图版本Hunyuan3D-2-MV能够结合2—4张标准视角图片,捕捉丰富的细节,优化3D生成模型产生的效果。与此同时,mini系列模型通过架构优化与算力提升,降低了硬件要求,可在NVIDIA 4080显卡甚至苹果M1 Pro芯片上运行,使3D模型的应用更为广泛。 腾讯自2024年11月发布第一代3D生成大模型以来,持续推动行业创新。如今Hunyuan3D-2.0在文本一致性、几何精度和画面质量等多项评测中超越业内顶级大模型。
DeTikZify是一款创新工具,专为科学家、学者以及任何需要创建精准数学或科学插图的人设计。它基于先进的语言模型,能够理解手绘草图或现有图片,并转换它们成为可直接用于LaTeX文档的TikZ代码,这一过程无需手动编码,大大节省了时间并提高了效率。 项目技术分析 该系统利用深度学习与蒙特卡洛树搜索(MCTS)的巧妙结合,实现智能迭代优化输出。这意味着,即使初始生成可能不完美,DeTikZify也能不断自我改进,逼近理想的图示效果,这一切都不需要额外的模型训练。其核心在于对TikZ语言的深刻理解和强大的视觉到代码的转换算法,实现了从图像到代码的无缝衔接。 应用场景 科研发表:快速将草图概念化为专业级别图形,适合论文发表。 教学辅助:教师可以迅速制作教学示意图,提升课堂讲解的直观性。 个人研究:帮助研究人员高效呈现复杂数据和理论模型。 学术共享:提供了一种标准化方式来重现和修改他人的图形,促进了学术交流。 项目特点 易用性:无论是科研新手还是专家,都能轻松上手,通过简单输入获取复杂的TikZ代码。 高精度转换:即使是细节繁复的图形,也能保持高度准确,忠实于原始设计。 交互式体验:通过Web UI或编程接口,提供了灵活的操作环境,允许实时调整和反馈。 教育资源:附带的教程和例子,使得学习和掌握TikZ编程变得更加平易近人。 开源贡献:基于强大的社区支持,持续迭代优化,任何人都能参与改进和扩展功能。 DeTikZify不仅是技术的进步,更是简化科学沟通的重要一步。它的出现预示着一个更加高效、直观的科研图表制作时代。立即尝试,让你的科学研究和文献展示更上一层楼,无需再被图形制作的繁琐细节所困扰。这个开源项目,等待着每一位寻求创新表达方式的研究者,共同探索科学之美。
针对大型语言模型设计的提示词优化器,将你的 AI 提示词提升至完美。专为大型语言模型 (LLM)、大型模型 (LM) 和 LMOps 设计的尖端提示词优化器。 产品特点: - 支持多目标优化,支持逐步优化结果,支持多个模型的输出; - 支持多种语言的提示词; - 10 秒快速出结果; - 支持部署; - 支持 API, 支持快速处理和集成; 使用评价: 目前,AI 的使用效果,除了 AI 自身的能力以外,用户的提问质量至为关键。高质量的提问才会有高质量的回答。因此,提示词十分重要。如果你感觉自己的提示词比较一般,可以使用 PromptPerfect 进行优化。这个产品的主要缺点是比较贵。
提示工程指南 提示词工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。 掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。 研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。 提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性,也可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力。 基于对大语言模型的浓厚兴趣,我们编写了这份全新的提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。
AutoGen是微软发布的一个工具,旨在帮助开发者创建基于大语言模型的复杂应用程序。 AutoGen是一个开源编程框架,旨在帮助开发者构建基于多智能体的应用程序,特别是那些涉及复杂工作流和对话模式的场景。AutoGen由微软推出,支持多种编程语言和跨语言开发,包括Python和.NET。其主要特点包括: 多智能体支持:AutoGen允许开发者创建多个智能体,这些智能体可以相互对话、协作完成任务。每个智能体可以扮演不同的角色,如用户智能体和助手智能体,分别负责提出需求和执行任务 对话模式:AutoGen支持多种对话模式,包括单智能体和多智能体对话。它提供了丰富的API和工具,使得开发者可以自定义智能体的行为和交互方式 工作流编排:AutoGen简化了复杂工作流的编排、自动化和优化。它能够处理大语言模型(LLM)的弱点,最大化LLM的性能 跨领域应用:AutoGen适用于多个领域,包括代码生成、自动翻译、自动摘要等。它支持多种LLM集成,使得开发者可以轻松构建复杂的应用程序
清华大模型团队 LeapLab 发布了一款面向 Agent 协作的开源框架:Cooragent。 你只需要说一句「咒语」:「创建一个 AI 情报收集秘书,为我收集最新的 AI 进展。」 魔法就会产生,Cooragent 就会根据你的个人偏好生成你专属的 AI 情报收集秘书,每天自动浏览网页,收集最重要的情报,总结成你喜欢的图文文档发送给你。 一句话创建智能体的工具:Cooragent,可与其他智能体协作完成复杂的任务,支持MCP 有两种工作模式: 1、Agent Factory: 只需描述,Cooragent就会根据需求生成一个智能体,其自动分析需求,通过记忆和扩展深入理解用户需求,挑选合适的工具自动打磨Prompt,逐步完成智能体构建 2、Agent Workflow: 只需描述目标任务,Cooragent会自动分析任务需求,挑选合适的智能体进行协作 提供CLI工具,可以快速创建,编辑,删除智能体 Cooragent 有两种工作模式:Agent Factory和Agent Workflow。 Agent Factory:您只需描述 Agent,Cooragent 便会根据您的需求生成 Agent。在 Agent Factory 模式下,系统会自动分析用户需求,并通过记忆和扩展深入了解用户,无需进行复杂的 Prompt 设计。基于对用户需求的深入了解,Planner 会选择合适的工具,自动细化 Prompt,逐步完成 Agent 的构建。构建完成后,Agent 即可立即使用,但您仍可对其进行编辑,以优化其行为和功能。 代理工作流:您只需描述想要完成的目标任务,Cooragent 会自动分析任务需求并选择合适的代理进行协作。规划器根据代理的专业领域进行组合,规划任务步骤和完成顺序,然后将任务交给任务分发节点“发布”进行发布。每个代理接收各自的任务并协作完成。Cooragent 可以在这两种模式下持续演进,从而创造无限可能。
Globus AI 专注于劳动力管理自动化。其 AI 代理有助于人才参与和职位安排。代理会自动读取并排序空缺职位,从而减少招聘经理的手动数据处理。Globus AI 能够快速将候选人与合适的职位匹配。 它采用自由文本分析,而非复杂的关键词系统。Globus AI 可以简化面试安排和职位安排的流程。人才可以通过简单的浏览器界面访问和接受职位。每次互动都有助于 AI 改进未来的匹配效果,最终目标是提高职位安排效率和员工满意度。 自动读取、排序空缺职位并确定其优先级。 使用文本分析快速将候选人与职位匹配。 简化经理和人才的排班和协调工作。 利用互动数据优化未来的推荐。
Jorie AI 将深厚的医疗保健专业知识与 AI 驱动的解决方案相结合,优化您收入周期的每一步。 从智能自动化到战略性 AI 咨询,我们助您自信地驾驭未来的医疗保健运营。 Jorie 已优化收款流程。使用我们的自动化技术,您将看到每日付款额增加 25%,坏账核销额减少 20%,从而减少需要收款的患者数量。
在本研究中,我们推出了 MiMo-7B 系列模型,这一系列模型从零开始训练,专为推理任务而生。我们基于 MiMo-7B-Base 进行的强化学习实验表明,我们的模型拥有非凡的推理潜力,甚至超越了规模更大的 32B 模型。此外,我们还对冷启动的 SFT 模型进行了强化学习训练,最终形成了 MiMo-7B-RL,它在数学和代码推理任务上均表现出色,性能堪比 OpenAI o1-mini。 我们开源了 MiMo-7B 系列,包括基础模型、SFT 模型、基于基础模型训练的强化学习模型以及基于 SFT 模型训练的强化学习模型的检查点。我们相信,这份报告以及这些模型将为开发强大的推理 LLM 提供宝贵的见解,造福更广泛的社区。 亮点 预训练:为推理而生的基础模型 我们优化了数据预处理流程,增强了文本提取工具包,并应用多维数据过滤来提高预训练数据中的推理模式密度。我们还采用多种策略来生成海量多样化的合成推理数据。 我们采用三阶段数据混合策略进行预训练。总体而言,MiMo-7B-Base 在约 25 万亿个 token 上进行了预训练。 我们将多标记预测作为额外的训练目标,以增强模型性能并加速推理。 训练后食谱:先驱推理模型 我们精选了 13 万道数学和代码题作为强化学习训练数据,可供基于规则的验证器进行验证。每道题都经过仔细的清理和难度评估,以确保质量。我们仅采用基于规则的准确率奖励机制,以避免潜在的奖励黑客攻击。 为了缓解高难度代码问题的稀疏奖励问题,我们引入了测试难度驱动的代码奖励机制。通过为不同难度级别的测试用例分配细粒度的分数,我们能够利用密集的奖励信号更有效地优化策略。 我们针对简单问题实施数据重采样策略,以提高推出采样效率并稳定策略更新,特别是在 RL 训练的后期阶段。 强化学习基础设施 我们开发了无缝部署引擎 (Seamless Rollout Engine),以加速强化学习 (RL) 的训练和验证。
phi-4是一个最先进的开放模型,它基于合成数据集、来自筛选过的公共领域网站的数据以及获取的学术书籍和问答数据集构建而成。该方法的目标是确保小型模型能够使用专注于高质量和高级推理的数据进行训练。该模型 phi-4经过了严格的增强和校准过程,结合了监督微调和直接偏好优化,以确保精确的指令遵循和强大的安全措施。 14B 参数,密集解码器专用 Transformer 模型 我们的模型旨在加速语言模型的研究,并将其作为生成式人工智能功能的基石。它适用于通用人工智能系统和应用(主要针对英语),这些系统和应用需要: 1. 内存/计算受限的环境。2 . 延迟受限的场景。3 . 推理和逻辑。 训练数据集 我们的训练数据是用于 Phi-3 的数据的扩展,包括来自以下各种来源的数据: 对公开的文档进行严格的质量筛选,选择高质量的教育数据和代码。 新创建的合成“类似教科书”的数据,用于教授数学、编码、常识推理、世界常识(科学、日常活动、心理理论等)。 获得学术书籍和问答数据集。 高质量的聊天格式监督数据涵盖各种主题,以反映人类在遵循指示、真实性、诚实和乐于助人等不同方面的偏好。 多语言数据约占我们整体数据的 8%。我们注重能够提升模型推理能力的数据质量,并筛选公开的文档,确保其包含的知识水平符合要求。 基准数据集 我们phi-4使用OpenAI 的 SimpleEval和我们自己的内部基准进行了评估,以了解该模型的功能,更具体地说: MMLU:用于多任务语言理解的流行聚合数据集。 数学:具有挑战性的竞赛数学问题。 GPQA:复杂的、研究生水平的科学问题。 DROP:复杂的理解和推理。 MGSM:多语言小学数学。 HumanEval:功能代码生成。 SimpleQA:事实回应。
Prompt Optimizer是一个强大的AI提示词优化工具,帮助你编写更好的AI提示词,提升AI输出质量。支持Web应用和Chrome插件两种使用方式。 核心特性 🎯 智能优化:一键优化提示词,支持多轮迭代改进,提升AI回复准确度 🔄 对比测试:支持原始提示词和优化后提示词的实时对比,直观展示优化效果 🔄 多模型集成:支持OpenAI、Gemini、DeepSeek等主流AI模型,满足不同需求 🔒 安全架构:纯客户端处理,数据直接与AI服务商交互,不经过中间服务器 💾 隐私保护:本地加密存储历史记录和API密钥,确保数据安全 📱 多端支持:同时提供Web应用和Chrome插件两种使用方式 🎨 用户体验:简洁直观的界面设计,响应式布局和流畅交互动效果 🌐 跨域支持:Vercel部署时支持使用Edge Runtime代理解决跨域问题(可能会触发部分厂商风控)
anthropic官方提示词库
MIDJOURNEY的提示词库,拥有超过25000个提示词
只显示前20页数据,更多请搜索
Showing 1 to 24 of 25 results