关键词 "CLIP" 的搜索结果, 共 24 条, 只显示前 480 条
Tool using CLIP model for image analysis
AI tool for converting videos into short-form content.
Paperclips is a web app that uses AI to create flashcards from course notes or web content.
Platform to convert audio/video to transcripts, clips, and posts.
AI video editor for social media creators
Looppanel simplifies UX research with transcripts, clips, notes, and Zoom integration.
Eklipse helps streamers convert and edit gaming highlights for multiple platforms.
AI art creation platform
Automated video creation for social media
AI clip generator for captivating shorts.
AI content creation assistant with video generator & tools
Advanced AI transcription service for audio, video, and YouTube files.
Clipdrop is a powerful AI-powered tool for effortless visual creation.
vidyo.ai helps repurpose podcasts and videos into shareable clips for social media.
AI tool to create engaging video shorts
AI-powered video clip creator
Create and edit videos easily with FlexClip, a free online video editor.
EchoCLIP是一个创新的人工智能模型。它能够分析心脏超声图像并理解专家的诊断解读。该模型即使在没有针对具体任务进行专门训练的情况下,也展现出了优秀的表现。模型在评估心功能和识别心内植入设备上达到良好性能,同时其长上下文变体EchoCLIP-R 在患者识别和跨模态检索等任务中展现了优异能力。这一研究推动了基础模型在心血管影像初步解读中的应用潜力。
TANGLE,一种幻灯片 + 表达 (S+E) 预训练的方法。从概念上讲,这种方法遵循视觉语言模型中广泛采用的 CLIP 原理。在这里,我们将幻灯片与其相应的基因表达谱对齐。生成的幻灯片编码器嵌入了组织的底层分子景观,因此可以用于各种下游任务。在这项工作中,我们专注于乳腺癌和肺癌的形态学亚型以及临床前药物安全性研究中的形态学病变检测。
Using ffmpeg command line to achieve an mcp server, can be very convenient, through the dialogue to achieve the local video search, tailoring, stitching, playback,clip, overlay, concat and other funct
PhonePi MCP enables seamless integration between desktop AI tools and your smartphone, providing 23+ direct actions including SMS messaging, phone calls, contact management, snippet creation and searc
A MCP server to interact with Server Clipboard, research purpose only!
苹果 FastVLM 的模型让你的 iPhone 瞬间拥有了“火眼金睛”,不仅能看懂图片里的各种复杂信息,还能像个段子手一样跟你“贫嘴”!而且最厉害的是,它速度快到飞起,苹果官方宣称,首次给你“贫嘴”的速度比之前的一些模型快了足足85倍!这简直是要逆天啊! 视觉语言模型的 “成长烦恼” 现在的视觉语
MMaDA(Multimodal Large Diffusion Language Models)是普林斯顿大学、清华大学、北京大学和字节跳动推出的多模态扩散模型,支持跨文本推理、多模态理解和文本到图像生成等多个领域实现卓越性能。模型用统一的扩散架构,具备模态不可知的设计,消除对特定模态组件的需求,引入混合长链推理(CoT)微调策略,统一跨模态的CoT格式,推出UniGRPO,针对扩散基础模型的统
只显示前20页数据,更多请搜索
Showing 97 to 120 of 122 results