2023-05-03 12:15:13, 欧易生物 上海欧易生物医学科技有限公司
细胞通讯领域重要工具 CellphoneDB 近期迎来了一次重大更新。在这之前,CellphoneDB 作为一个专注于细胞间信号传导研究的在线数据库,在探索生命科学中发挥着重要作用。CellphoneDB从根据已知蛋白质相互作用信息构建细胞间通讯网络模型,到对不同类型的细胞、组织和物种进行研究,再到对大规模的蛋白质相互作用进行筛选,历经多次升级优化的 CellphoneDB 提供了丰富的工具和数据资源,帮助研究人员更好地理解生物体内细胞间的相互作用,并揭示相关生物过程的分子机制。
此次CellphoneDB的数据库版本更新到了4.1.0版本,相较于上个版本,它的受配体对的数量更少,但是它结果准确性也得到了进一步提高。此次数据库更新后,去除了所有未经过筛选的外部数据库,并添加了更多经过手动筛选的高可信度的受配体对,总数达到2923个!
CellphoneDB软件同时也更新到4.0版本。在这次更新中,CellphoneDB 的运行速度得到了大幅提升,新版 CellphoneDB软件 采用 Python 编写,输入的count文件不再局限于matrix格式的文件,可以直接使用h5ad格式的文件,并且读取速度更快。对于cellphoneDB的运行结果,此次开发团队也提供了一种可以根据细胞类型、受配体对或者特定基因进行筛选的方法,而且本次更新大幅提高了基于数学统计方法(cpdb_statistical_analysis_method)的计算效率。本小欧用3万个细胞的数据做了一个测试,新版cellphoneDB的运行速度比之前快了一倍不止!
图1 不同版本软件的运行速度,其中V4.1版本的数据库由4.0版本的cellphoneDB软件运行,其他两个版本的数据库由3.0版本的软件运行
除了运行速度的变化,我们通过network图也能发现此次更新的数据库与之前的数据库相比较,在结果中得到受配体数量上也发生了较大的变化。
图2 V3版本数据库运行结果
图3 V4版本数据库运行结果
图4 V4.1版本数据库运行结果
Python版本的cellphoneDB运行代码非常简洁,而且作者给每一个参数都做了非常详细的注释,可以说是非常照顾新手小白了。下面就让我们一起来看看吧!
##配置环境
conda create -n cpdb python=3.8
source activate cpdb
pip install cellphonedb
##下载database
cpdb_version=”v4.1.0”
cpdb_target_dir = os.path.join(''/data/database/db'', cpdb_version)
from cellphonedb.utils import db_utils
db_utils.download_database(cpdb_target_dir, cpdb_version)
接下来我们使用cpdb_statistical_analysis_method方法进行计算,meta_file_path参数使用是一列包含每个细胞barcode和对应细胞类型的dataframe信息,counts_file_path参数可以提供h5ad文件,也可以提供counts矩阵文件。
from cellphonedb.src.core.methods import cpdb_statistical_analysis_method
deconvoluted, means, pvalues, significant_means = cpdb_statistical_analysis_method.call(
cpdb_file_path = “/data/database/db/v4.1.0”,
meta_file_path = “test_meta.txt” ,
counts_file_path = “test.h5ad ” ,
counts_data = ''hgnc_symbol'',
iterations = 1000,
threshold = 0.1,
threads = 4,
debug_seed = 42,
result_precision = 3, # Sets the rounding for the mean values in significan_means.
pvalue = 0.05, # P-value threshold to employ for significance.
subsampling = False, # To enable subsampling the data (geometri sketching).
subsampling_log = False, # (mandatory) enable subsampling log1p for non log-transformed data inputs.
subsampling_num_pc = 100, # Number of componets to subsample via geometric skectching (dafault: 100).
subsampling_num_cells = 1000, # Number of cells to subsample (integer) (default: 1/3 of the dataset).
separator = ''|'', # Sets the string to employ to separate cells in the results dataframes "cellA|CellB".
debug = False, # Saves all intermediate tables employed during the analysis in pkl format.
output_path = out_path, # Path to save results.
output_suffix = None # Replaces the timestamp in the output files by a user defined string in the (default: None).
)
输出的内容为statistical_analysis_means.txt,statistical_analysis_deconvoluted.txt, statistical_analysis_pvalues.txt和statistical_analysis_significant_means.txt四个文件。
可以使用search_utils函数对输出的结果进行进一步的查询,具体代码如下:
```
from cellphonedb.utils import search_utils
search_results = search_utils.search_analysis_results(
query_cell_types_1 = [''EVT_1'', ''EVT_2'', ''GC'', ''eEVT'', ''iEVT''], # List of cells 1, will be paired to cells 2 (list or ''All'').
query_cell_types_2 = [''PV MMP11'', ''PV MYH11'', ''PV STEAP4''], # List of cells 2, will be paired to cells 1 (list or ''All'').
query_genes = [''TGFBR1''],
query_interactions = [''CSF1_CSF1R''],
significant_means = “statistical_analysis_means.txt”, # significant_means file generated by CellPhoneDB.
deconvoluted = “statistical_analysis_deconvoluted.txt”,
separator = ''|'',
long_format = True
)
代码的介绍就到这里啦,cellphoneDB自带的画图功能较弱,小欧推荐大家使用ktplotspy包进行结果的展示哦!
CellphoneDB在单细胞分析领域有着举足轻重的位置,在阐明生物学过程中细胞间通讯的复杂性、多样性和动态性方面有重要意义。此次更新后,软件运行的速度更快,结果更加准确!这无疑会为我们在细胞通讯领域的深入研究提供有力支撑。
上海欧易生物医学科技有限公司(简称:“欧易生物”),成立于2009年,经过十多年稳健发展,已经成长为拥有“晶准生物”“鹿明生物”“青岛欧易”三家全资子公司,近600名员工的生物科技领域集团型企业。
欧易生物始终秉持着“硬数据 · 好服务”的理念服务于大众。为大生命科学、大健康相关研究领域,以及医药、食品及日化企业的客户,提供从基础研究到药物靶点发现、药理药效及安全性评价、疾病分子标志物筛选、致病菌及耐药菌溯源等相关技术服务,全力加速客户研究与开发进程,提升客户研究与开发价值。
欧易生物携手旗下子公司,实现了中心法则上、中、下游多层组学的串联,从基因组、转录组、表观组、微生物组,到蛋白组、代谢组及近年热门的单细胞&空间多组学技术服务,为科研用户提供全面的创新多组学技术服务。
欧易生物已先后获得闵行区研发机构、闵行区企业技术中心、上海市科技小巨人企业、产权管理体系认证企业等资质。拥有授权发明专利30+项,在受理发明专利50+项,软件著作权150+项。
END
排版人:小久
原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。
04-17
诚邀您参加2024中国肿瘤标志物学术大会04-16
临床质谱实验室常用小设备04-16 英盛生物
应用培训 | TA仪器5月广州实验室培训报名已开启04-16
应用培训 | TA仪器4月北京实验室培训火热报名中04-16
传承不息,焕新升级 | 德国元素OEA有机元素分析仪选型方案04-16 德国元素
凯撒的归凯撒,上帝的归上帝——三个带电化合物的峰型解决带来的启发04-16 星谱实验室
走进信阳师范大学04-16
应用分享丨Micro-XRF技术在高性能材料研发中的革新应用04-16
【精彩回顾】因科技·纳万物 2024进化发育学术论坛圆满落幕04-15
蓄势聚力 蓬勃葳蕤 |《皖仪季风·春生》四月刊04-15 WAYEAL皖仪
颗粒分析的新维度 | DIMENSIONS LS for SYNC04-15 大昌华嘉
邀请函 | 第九届环境友好型农药制剂加工技术研讨会暨2024年中国农药制剂创新国际论坛04-15 大昌华嘉
邀请函 | 2024(第八届)细胞外囊泡前沿与转化大会04-15 大昌华嘉
胶束表面活性剂中的药物释放—Rheolab应用04-15 大昌华嘉
使用FlashSmart元素分析仪对金属基体样品中碳氢氮硫氧的测试04-15 大昌华嘉
展会邀请丨如期开展!奥谱天成诚邀您参加慕尼黑俄罗斯分析生化展览会(Analitika Expo 2024)04-15
血液专题 | 血液全场景解决方案上线!直播教学帮您深入了解这些技术怎么用~04-15
凝聚科技力量·共筑交通安全:欧美大地引领交通安全设施测试创新发展04-15 公路部
创新2024 | 无氯仿提取RNA,让科研更安心!04-15 赛默飞生命科学