梅斯AI导航站
首页 梅斯小智 MCP 排行榜 资讯 临床指南 期刊 梅斯公开课 收录

搜索结果

关键词 "AIs" 的搜索结果, 共 2 条, 只显示前 480 条

ScribbleDiff

ScribbleDiff

文本到图像的扩散模型的最新进展已取得显著成功,但它们往往难以完全捕捉用户的意图。现有的使用文本输入结合边界框或区域蒙版的方法无法提供精确的空间引导,常常导致对象方向错位或意外。为了解决这些限制,我们提出了涂鸦引导扩散(ScribbleDiff),这是一种无需训练的方法,它利用用户提供的简单涂鸦作为视觉提示来引导图像生成。然而,将涂鸦纳入扩散模型存在挑战,因为涂鸦具有稀疏和单薄的特性,很难确保准确的

PaddleOCR-VL – 百度飞桨开源的多模态文档解析模型

PaddleOCR-VL – 百度飞桨开源的多模态文档解析模型

PaddleOCR-VL是百度飞桨团队开源的多模态文档解析模型,参数量仅0.9B,专为低算力设备优化。在国际权威评测OmnidocBench V1.5中以92.6分登顶全球第一,超越GPT-4o等主流模型。模型采用双阶段架构:PP-DocLayoutV2负责版面分析,PaddleOCR-VL-0.9B完成内容识别,支持109种语言,能精准处理表格、公式、图表等复杂元素,输出结构化Markdown/

只显示前20页数据,更多请搜索

« Previous Next »

Showing 121 to 122 of 122 results

1 2 3 4 5 6

©Copyrigh2012-至今 梅斯(MedSci)

本站旨在介绍医药健康研究进展和信息,不作为诊疗方案推荐。如需获得诊断或治疗方面指导,请前往正规医院就诊。

用户应遵守著作权法,尊重著作权人合法权益,不违法上传、存储并分享他人作品。投诉、举报、维权邮箱:editor@medsci.cn,或在此留言

备案号 沪ICP备14018916号-1 沪公网安备 31010402000380 信息举报中心 违法和不良信息举报中心 上海网警网络110