細(xì)胞轉(zhuǎn)錄輸出有助于細(xì)胞類型和狀態(tài)的確定。新興技術(shù),如單細(xì)胞RNA-seq (scRNA-seq)改善了識(shí)別和描述的細(xì)胞狀態(tài)異質(zhì)性由不同的基因表達(dá)程序和擁有先進(jìn)我們理解細(xì)胞多樣性的功能作用在細(xì)胞分化等領(lǐng)域,對(duì)刺激的回應(yīng),和失調(diào)疾病。
許多聚類算法建議對(duì)scRNA-seq數(shù)據(jù)進(jìn)行劃分,以識(shí)別具有相關(guān)轉(zhuǎn)錄程序的細(xì)胞群,將細(xì)胞劃分為已知的細(xì)胞類型或狀態(tài),在某些情況下描述新的稀有細(xì)胞種群?;趌ouva的聚類方法s1是應(yīng)用最廣泛的scRNA-seq聚類方法之一。這些算法以貪婪的方式迭代地優(yōu)化社區(qū)度量,即Newman-Girvan模塊化,以生成單個(gè)的單元?jiǎng)澐?。在大多?shù)scRNA-seq分析工作流程,確定細(xì)胞具有相似的轉(zhuǎn)錄組的集群模式然后使用降維可視化技術(shù),如t-distributed隨機(jī)鄰居嵌入(t-SNE) 2,在高維基因表達(dá)空間隨機(jī)減少到項(xiàng)目每個(gè)細(xì)胞的位置在一個(gè)二維曲面。這個(gè)工作流程導(dǎo)致識(shí)別單個(gè)單層的單元分區(qū),這些單元使用缺乏定量的組間和組內(nèi)關(guān)系信息的可視化方法進(jìn)行解釋??紤]到精確的細(xì)胞狀態(tài)定義和國(guó)米和intra-relationships是上下文相關(guān)的,可能不適合一個(gè)uni-layer分區(qū)的細(xì)胞,而是一個(gè)層次結(jié)構(gòu)的嵌套細(xì)胞狀態(tài),我們介紹了一個(gè)范式轉(zhuǎn)變套件工具的分析,解釋和單細(xì)胞的可視化數(shù)據(jù)通過(guò)啟用同步描述和可視化的多層細(xì)胞演化支。
TooManyCells是一套基于圖形的算法和工具,可在保持和呈現(xiàn)細(xì)胞群之間的相互關(guān)系的同時(shí),高效,全局且無(wú)偏見(jiàn)地識(shí)別和鑒定細(xì)胞進(jìn)化枝。TooManyCells提供了一種新穎的單細(xì)胞聚類算法ClusterTree,該算法為單細(xì)胞測(cè)量分析實(shí)現(xiàn)了有效的無(wú)矩陣分裂分層光譜聚類。此外,TooManyCells 能夠評(píng)估細(xì)胞多樣性并估計(jì)調(diào)查異質(zhì)種群中特定水平的細(xì)胞物種豐富度所需的樣本量。TooManyCells還提供BirchBeer了一個(gè)完全可定制的新穎模型,用于以單細(xì)胞分辨率可視化分層細(xì)胞聚類分析。在渲染聚類樹(shù)時(shí),BirchBeer利用著色標(biāo)簽,縮放分支,模塊化疊加,內(nèi)部節(jié)點(diǎn)標(biāo)簽,葉節(jié)點(diǎn)摘要等的加權(quán)平均混合,可以對(duì)單細(xì)胞進(jìn)化枝進(jìn)行多層和多方面的探索。為了提供最大的適用性,TooManyCells加載并生成幾種標(biāo)準(zhǔn)文件格式。因此,可以將替代聚類算法與可視化結(jié)合使用,從而在多種方法之間提供協(xié)調(diào),以幫助闡明單個(gè)單元格之間的關(guān)系。這些聚類和可視化算法能夠描述依賴于上下文和應(yīng)用程序的細(xì)胞集群,并加速探索和量化細(xì)胞分支之間的相互關(guān)系。
近日,來(lái)自賓夕法尼亞大學(xué)佩雷爾曼醫(yī)學(xué)院的病理學(xué)和檢驗(yàn)醫(yī)學(xué)系,賓夕法尼亞大學(xué)佩雷爾曼醫(yī)學(xué)院遺傳學(xué)系,美國(guó)賓夕法尼亞州佩雷爾曼醫(yī)學(xué)院的賓夕法尼亞大學(xué)艾布拉姆森家庭癌癥研究所,法尼亞大學(xué)賓夕法尼亞大學(xué)表生遺傳研究所課題組在Nat. Methods 發(fā)表題為TooManyCells identifies and visualizes relationships of single-cell clades的研究,報(bào)道了一種新軟件——TooManyCells,可以識(shí)別并可視化單細(xì)胞進(jìn)化枝的關(guān)系。
這組工具通過(guò)在依賴于上下文和應(yīng)用程序的范圍內(nèi)同時(shí)比較單元狀態(tài),從而在分析和解釋單細(xì)胞數(shù)據(jù)方面提供了范式轉(zhuǎn)換。這種轉(zhuǎn)變的一個(gè)副產(chǎn)品是對(duì)稀有種群的即時(shí)檢測(cè)和可視化,其性能優(yōu)于以前的算法,這是通過(guò)將這些工具應(yīng)用于來(lái)自各種小鼠器官的現(xiàn)有單細(xì)胞RNA-seq數(shù)據(jù)集而得到證明的。
一、TooManyCells 用于單細(xì)胞分辨率的聚類和可視化
例如,通過(guò)scRNA-seq測(cè)量對(duì)遞歸結(jié)構(gòu)進(jìn)行遞歸劃分可以概括脾臟中的淋巴樣群體,在該群體中,分裂將B與T細(xì)胞分開(kāi),然后可以將血漿細(xì)胞譜系與過(guò)渡性B細(xì)胞分離,然后分離成漿細(xì)胞和漿細(xì)胞,直至達(dá)到具有不同B細(xì)胞受體結(jié)構(gòu)的漿細(xì)胞的分離。要確定單元狀態(tài)的連續(xù)體ClusterTree,TooManyCells,從屬于單個(gè)組的所有單元格開(kāi)始,作為聚類樹(shù)的根(圖1a和1b)。這些細(xì)胞由具有m個(gè)細(xì)胞和n個(gè)基因的m × n矩陣表示。矩陣中的每個(gè)條目都是細(xì)胞中某個(gè)基因的豐度數(shù)據(jù)。因此,ClusterTree生成嵌套單元簇的層次結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)都是給定規(guī)模的簇,葉節(jié)點(diǎn)是細(xì)粒度簇,其中任何附加的二分分割都將與單元的隨機(jī)分裂一樣好。
二、ClusterTree:用于scRNA-seq的無(wú)矩陣分裂分層光譜聚類算法
單細(xì)胞分辨率的可視化是scRNA-seq數(shù)據(jù)解釋的組成部分。為了適應(yīng)對(duì)嵌套細(xì)胞簇的層次結(jié)構(gòu)的詢問(wèn),TooManyCells它配備了BirchBeer一個(gè)完全可定制的新穎軟件,專門為清晰,可解釋地顯示細(xì)胞簇的層次結(jié)構(gòu)而開(kāi)發(fā)(圖2a)。BirchBeer是專為顯示整個(gè)樹(shù)而設(shè)計(jì)的,它具有其他一些功能,可幫助用戶查找相關(guān)種群并促進(jìn)數(shù)據(jù)探索。BirchBeer可以根據(jù)該子樹(shù)中的單元格數(shù)量縮放每個(gè)分支,并使用通過(guò)該分支連接的單元格標(biāo)簽顏色的加權(quán)平均混合為每個(gè)分支點(diǎn)著色(圖2a)?;焐梢栽诙鄠€(gè)范圍內(nèi)增強(qiáng)對(duì)重疊或不同種群的識(shí)別(圖2b)。葉節(jié)點(diǎn)上的單元組可以使用多種可視化格式。葉節(jié)點(diǎn)可以顯示一個(gè)餅狀圖,顯示其細(xì)胞組成的分布。為了以單細(xì)胞分辨率描述信息,可以在葉節(jié)點(diǎn)處對(duì)每個(gè)單個(gè)細(xì)胞進(jìn)行渲染和顏色編碼,以可視化其他信息,例如細(xì)胞的確切數(shù)量,每個(gè)細(xì)胞上給定基因的表達(dá)水平以及其他信息。葉簇(圖2b)。為了幫助解釋和分析復(fù)雜的細(xì)胞混合物,birch-tree提供了幾種修剪聚類樹(shù)的方法(圖2c-k)。這些方法包括距根的步驟數(shù),最小葉節(jié)點(diǎn)大小以及基于分位數(shù)的修剪解決方案(圖2c)。重要的是,TooManyCells可以在葉節(jié)點(diǎn)群集和群集層次結(jié)構(gòu)中的所有嵌套群集之間進(jìn)行比較。為了幫助選擇給定的細(xì)胞分區(qū),請(qǐng)BirchBeer提供每個(gè)內(nèi)部或葉節(jié)點(diǎn)群集標(biāo)識(shí)號(hào)的覆蓋圖,可用作重疊TooManyCells表達(dá)式分析模塊的輸入,以比較分析不同規(guī)模的群集或進(jìn)行其他下游分析(圖2d) 。由于分支縮放寬度在美學(xué)上可能是主觀的,因此可以對(duì)其進(jìn)行調(diào)整(圖2e與圖2c)或完全禁用(圖2f)。由于候選分割的模塊性證明了該分裂相對(duì)于隨機(jī)分割模型的重要性,因此BirchBeer可以將模塊顯示為圓周黑暗程度不同的黑圈,以幫助識(shí)別彼此非常不同的種群(圖2g)。BirchBeer可以可視化內(nèi)部和葉節(jié)點(diǎn)的多樣性(圖2h)。除了在樹(shù)上覆蓋連續(xù)變量之外,還BirchBeer可以覆蓋離散變量。例如,BirchBeer可以覆蓋每個(gè)細(xì)胞和簇的UMI計(jì)數(shù)(圖2i),以及一個(gè)或多個(gè)基因的表達(dá)狀態(tài)以適應(yīng)可視細(xì)胞分級(jí)分析(圖2j和2k)。
三、TooManyCells 識(shí)別純細(xì)胞簇
簇純度的比較分析。(a)所分析的種群由x軸(胸腺,脾臟,骨髓,肢體肌肉,舌頭,心臟,肺,乳腺,膀胱,膀胱)左側(cè)的x軸上的部位(即器官和組織)的數(shù)量表示,腎臟,肝臟}。比較了集群多樣性的分布。從TooManyCells分層群集樹(shù)中考慮了全部,64或32個(gè)群集(從根開(kāi)始的所有步驟,從根開(kāi)始的6個(gè)步驟或從根開(kāi)始的5個(gè)步驟)群集。所有算法均使用默認(rèn)過(guò)濾和參數(shù)。較高的多樣性表示較低的準(zhǔn)確性。(b)逆加權(quán)分集定義為逆最小-最大歸一化分集和簇大小與單元總數(shù)之比的乘積。值越大表示簇越純凈。(c)與(a)相同,不同之處TooManyCells標(biāo)準(zhǔn)化程序:TooManyCells默認(rèn)標(biāo)準(zhǔn)化(默認(rèn)標(biāo)度)項(xiàng)頻率-逆文檔頻率(tf-idf),上四分位數(shù)標(biāo)準(zhǔn)化(Upper Quartile Scaled),總和基因中位數(shù)計(jì)數(shù)標(biāo)準(zhǔn)化(Cell和Gene Scaled),然后進(jìn)行tf-idf標(biāo)準(zhǔn)化。(d)與(b)相同,不同的TooManyCells歸一化程序相同。
四、TooManyCells 準(zhǔn)確描繪出細(xì)胞混合物中的稀有種群
從兩個(gè)稀有種群與一個(gè)普通細(xì)胞種群混合中檢測(cè)細(xì)胞,以此作為通用聚類算法(a和b)的基準(zhǔn)。從左到右的列:用實(shí)際類型(即器官)標(biāo)記的細(xì)胞,以及用scRNA-seq聚類算法分配的簇標(biāo)記的細(xì)胞。從上到下的行:Monocle,Phenograph,Seurat和Cellranger t-SNE投影。提出了對(duì)a)900個(gè)普通(舌)細(xì)胞和100個(gè)稀有(50個(gè)乳腺和50個(gè)骨髓)細(xì)胞以及b)990個(gè)普通和10個(gè)稀有細(xì)胞(5個(gè)乳腺和5個(gè)骨髓)的分析。(c)結(jié)果TooManyCells聚類和可視化。左:900(普通)(普通)和100(罕見(jiàn))。右:990個(gè)普通細(xì)胞和10個(gè)稀有細(xì)胞。(d)量化稀有人口基準(zhǔn)。對(duì)于每次運(yùn)行,性能代表真正的稀有對(duì)(乳腺與乳腺以及骨髓和骨髓在同一簇中)/總稀有對(duì)(真正的稀有對(duì)和具有骨髓的乳腺)。
五、小鼠脾臟中成漿細(xì)胞亞群的鑒定
(a) TooManyCells用先前識(shí)別的細(xì)胞類型標(biāo)記的小鼠脾臟數(shù)據(jù)集的聚類樹(shù)(b)來(lái)自(a)的具有新識(shí)別的b細(xì)胞亞型的樹(shù)(c)與所有其他細(xì)胞相比,來(lái)自(b)的成漿細(xì)胞節(jié)點(diǎn)的前100個(gè)差異表達(dá)基因的MyGeneSet基因表達(dá)(d) (a)中的細(xì)胞使用秀蘭的加工和t-SNE投影,用TooManyCells對(duì)樹(shù)葉進(jìn)行聚類,為每片樹(shù)葉分配不同的顏色類似的顏色表示樹(shù)中的附近位置,例如,粉色和紫色在樹(shù)中的位置比粉色和綠色更近(e) (d)中t-SNE投影的坐標(biāo),其坐標(biāo)為(b)中子集的人口成漿細(xì)胞是橙色的,分布在整個(gè)b細(xì)胞群中(f)來(lái)自(d)中t-SNE投影的坐標(biāo),該投影由修生成的簇標(biāo)簽著色。
六、SOX2OT對(duì)體內(nèi)BCSC生長(zhǎng)和致瘤性的影響
SOX2OT對(duì)體內(nèi)BCSC生長(zhǎng)和致瘤性的影響。顯示了從小鼠收集的腫瘤。b測(cè)量并分析了sh-SOX2OT和sh-NC治療組的腫瘤重量。c測(cè)量并分析了sh-SOX2OT和sh-NC治療組的腫瘤體積曲線。d測(cè)量和分析了sh-SOX2OT和sh-NC治療組的無(wú)腫瘤比例。敲低SOX2OT在體內(nèi)抑制膀胱癌細(xì)胞的生長(zhǎng)。e和f敲低SOX2OT在體內(nèi)的BCC中增加了miR-200c的表達(dá),降低了SOX2和SOX2靶基因的表達(dá),并抑制了EMT。G:擊倒SOX2OT降低了SOX2的表達(dá),并且SOX2OT和SOX2在BCC體內(nèi)共定位。h和i擊倒SOX2OT會(huì)降低體內(nèi)BCC中SOX2和ki67的表達(dá)。j細(xì)胞熒光示蹤系統(tǒng)的示意圖。敲除SOX2OT的k和l顯著降低了異種移植物中sh-SOX2OT細(xì)胞的比例。數(shù)據(jù)顯示為平均值±SD。* p ?<0.05;** p ?<0.01
七、敲減SOX2OT抑制膀胱癌轉(zhuǎn)移
SOX2OT對(duì)膀胱癌肺轉(zhuǎn)移的影響以及SOX2OT致癌作用的示意圖。a和b sh-SOX2OT組的熒光素酶信號(hào)顯著低于sh-NC組的熒光素酶信號(hào)。c兩個(gè)治療組的小鼠體重之間無(wú)顯著差異。d和e與sh-NC組相比,sh-SOX2OT組的肺轉(zhuǎn)移數(shù)目和大小明顯減少。f和h降低SOX2OT的表達(dá)會(huì)降低肺轉(zhuǎn)移中SOX2的表達(dá)。G在sh-SOX2OT組中,E-cadherin的表達(dá)明顯高于在sh-NC組中。敲除SOX2OT可降低肺轉(zhuǎn)移中N-鈣黏著蛋白的表達(dá)。i SOX2OT在膀胱癌中的致癌作用示意圖