TANGLE,一种幻灯片 + 表达 (S+E) 预训练的方法。从概念上讲,这种方法遵循视觉语言模型中广泛采用的 CLIP 原理。在这里,我们将幻灯片与其相应的基因表达谱对齐。生成的幻灯片编码器嵌入了组织的底层分子景观,因此可以用于各种下游任务。在这项工作中,我们专注于乳腺癌和肺癌的形态学亚型以及临床前药物安全性研究中的形态学病变检测。
相关推荐

PyDESeq2
PyDESeq2 是DESeq2方法的 python 实现, 用于对大量 RNA 序列数据进行差异表达分析 (DEA),最初用 R 语言编写。其目的是方便 python 用户进行 DEA 实验。

gget-查询基因组参考数据库
gget是一个免费的开源命令行工具和 Python 包,可以高效地查询基因组数据库。gget 由一组独立但可互操作的模块组成,每个模块旨在通过一行代码实现一种类型的数据库查询。

scanpy-Python 中的单细胞分析
Scanpy 是一个可扩展的工具包,用于分析与anndata联合构建的单细胞基因表达数据。它包含预处理、可视化、聚类、轨迹推断和差异表达测试等功能。该工具包基于 Python 实现,可高效处理超过一百万个细胞的数据集。

Tangram
Tangram 是一个基于scanpy的 Python 包,用PyTorch编写,用于将单细胞(或单核)基因表达数据映射到空间基因表达数据上。单细胞数据集和空间数据集应来自同一解剖区域/组织类型,理想情况下来自同一生物学重复,并且需要共享一组基因。Tangram 通过拟合共享基因的基因表达来在空间上对齐单细胞数据。

CellChat
用于从单细胞和空间分辨转录组学推断、可视化和分析细胞间通讯的 R 工具包

spacexr--空间转录组学中的细胞类型识别和细胞类型特异性差异表达
Spatial-eXpression-R:细胞类型识别(包括细胞类型混合)和空间转录组学的细胞类型特异性差异表达

Stereopy--空间转录组分析工具包
Stereopy是一款基础且全面的工具,用于基于空间转录组学数据(例如 Stereo-seq(空间增强分辨率组学测序)数据)进行数据挖掘和可视化。我们将在此添加更多分析工具,这些工具可能来自其他热门工具,也可能由我们自行开发,以满足多样化的需求。同时,我们仍在努力提升其性能和计算效率。

stLearn--空间转录组数据下游分析工具包
stLearn旨在全面分析空间转录组学 (ST) 数据,以研究未分离组织内的复杂生物学过程。ST 正在成为单细胞 RNA 测序的“下一代”,因为它为完整组织切片中细胞的转录谱添加了空间和形态背景。然而,现有的 ST 分析方法通常将捕获的空间和/或形态数据用作可视化工具,而不是将其用作模型开发的信息特征。我们开发了一种分析方法,该方法可利用所有三种数据类型:空间距离、组织形态和来自 ST 数据的基因表达测量 (SME)。这种组合方法使我们能够更准确地模拟潜在的组织生物学,并允许研究人员解决三个主要研究领域的关键问题:细胞类型识别、空间轨迹重建以及未分离组织样本内细胞间相互作用的研究。

Cell2location--单细胞和空间转录组学
通过整合单细胞和空间转录组学(细胞2位置模型)全面绘制组织细胞结构图

SPATA2--空间转录组学分析工具箱
SPATA2 ,一个全面的空间转录组学分析工具箱

Baysor--空间转录组学数据的贝叶斯分割
Baysor 是一款用于对基于成像的空间转录组学数据进行细胞分割的工具。它根据细胞的转录组成、大小和形状的可能性来优化分割。该方法可以考虑细胞核或细胞质染色,也可以仅基于检测到的分子进行分割。

SPOTlight
SPOTlight提供了一个工具,可以从单细胞参考中对细胞混合物进行反卷积。该工具最初是为 10X 的 Visium(空间转录组学)技术开发的,可用于所有输出细胞混合物的技术。它与 Bioconductor 的Single Cell Experiment和Spatial Experiment类以及密集和稀疏矩阵兼容。此外,该软件包还提供可视化工具来评估反卷积的结果。简而言之,SPOTlight它基于通过 NMFreg 模型为每种细胞类型找到主题配置文件签名,然后优化细胞类型比例以拟合我们想要反卷积的混合物。

Spateo
Spateo(https://github.com/aristoteleo/spateo-release),这是一个3D时空建模框架,并将其应用于E9.5和E11.5的3D小鼠胚胎发生图谱,捕获了800万个细胞。Spateo支持可扩展、部分、非刚性对齐、多层细化和网格校正,以创建整个胚胎的分子全息图。它引入了数字化方法,揭示了从亚细胞到整个器官的多层次生物学,识别了新兴3D结构(例如,中脑-后脑边界(MHB)等次级组织者)沿正交轴的表达梯度。Spateo进一步联合模拟细胞间和细胞内相互作用,以解剖3D结构中的信号传导图谱,包括丘脑内界带(ZLI)。最后,Spateo 引入了细胞迁移的“形态矢量场”,并整合了空间微分几何,揭示了小鼠心脏器官发生不对称等现象背后的分子程序,将宏观变化与分子动力学联系起来。因此,Spateo 能够在分子水平上研究三维空间中器官生态学随时间的变化。

cellxgene
CZ CELLxGENE Annotate(发音为“cell-by-gene”)是一款用于单细胞数据集(例如来自人类细胞图谱 (Human Cell Atlas)的数据集)的交互式数据探索器。我们利用现代 Web 开发技术,快速可视化至少 100 万个细胞,希望能够帮助生物学家和计算研究人员探索他们的数据。

multimodal-cancer-origin-prediction多模态癌症起源预测
基于深度学习的组织学和基因组学多模态整合,以改善癌症起源预测

PathomicFusion
组织病理学图像可以使用 CNN 或 GCN 进行处理,以提高参数效率,也可以两者结合使用。该设置适用于将多种组学模式与组织病理学整合,并可用于改进诊断、预后和治疗反应的评估。

PORPOISE
PORPOISE,这是一个交互式的免费平台,可直接生成由我们的模型确定的数千名多种癌症类型患者的预后标记。为了验证这些模型解释的预后价值,我们分析了 WSI 中关注度较高的形态学区域,结果表明,在 14 种癌症类型中,有 12 种存在肿瘤浸润淋巴细胞,这证实了癌症预后良好。

MAPS--空间生物学中蛋白质组学分析
MAPS(用于空间生物学中蛋白质组学分析的机器学习),这是一种机器学习方法,能够从空间蛋白质组学数据中快速、精确地识别细胞类型,并达到人类水平的精度。经多个内部和公开的 MIBI 和 CODEX 数据集验证,MAPS 在速度和精度方面均优于现有的注释技术,即使对于通常具有挑战性的细胞类型(包括免疫来源的肿瘤细胞),也能达到病理学家级别的精度。通过实现快速部署和可扩展的机器学习注释的普及,MAPS 拥有巨大的潜力,可以加速组织生物学和疾病理解的进步。