梅斯AI导航站
首页 梅斯小智 MCP 资讯 临床指南 医学计算 期刊 梅斯公开课 留言

搜索结果

关键词 "视频理解" 的搜索结果, 共 2 条, 只显示前 480 条

ViLAMP

ViLAMP

ViLAMP(VIdeo-LAnguage Model with Mixed Precision)是蚂蚁集团和中国人民大学联合推出的视觉语言模型,专门用在高效处理长视频内容。基于混合精度策略,对视频中的关键帧保持高精度分析,显著降低计算成本提高处理效率。ViLAMP在多个视频理解基准测试中表现出色,在长视频理解任务中,展现出显著优势。ViLAMP能在单张A100 GPU上处理长达1万帧(约3小时)

BILIVE

BILIVE

BILIVE 是基于 AI 技术的开源工具,专为 B 站直播录制与处理设计。工具支持自动录制直播、渲染弹幕和字幕,支持语音识别、自动切片精彩片段,生成有趣的标题和风格化的视频封面。BILIVE 能自动将处理后的视频投稿至 B 站,综合多种模态模型,兼容超低配置机器,无需 GPU 即可运行,适合个人用户和小型服务器使用。 1. Introduction Have you notice

只显示前20页数据,更多请搜索

©Copyrigh2012-至今 梅斯(MedSci)

本站旨在介绍医药健康研究进展和信息,不作为诊疗方案推荐。如需获得诊断或治疗方面指导,请前往正规医院就诊。

用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。投诉、举报、维权邮箱:editor@medsci.cn,或在此留言

备案号 沪ICP备14018916号-1 沪公网安备 31010402000380 信息举报中心 违法和不良信息举报中心 上海网警网络110