国产精品高清一区二区三区不卡-国产精品一区二区三区免费视频-日韩免费高清一级毛片-亚洲欧美一区二区三区国产精品-日韩欧美一区二区三区不卡视频-亚欧免费视频一区二区三区-亚洲欧美日韩一区成人-欧美日韩视频综合一区无弹窗-精品日韩在线视频一区二区三区-国内精品视频一区二区三区

你好,歡迎進(jìn)入江蘇優(yōu)軟數(shù)字科技有限公司官網(wǎng)!

誠信、勤奮、創(chuàng)新、卓越

友好定價(jià)、專業(yè)客服支持、正版軟件一站式服務(wù)提供

13262879759

工作日:9:00-22:00

dnastar序列比對 福君基因丨納昂達(dá)科技丨Sentieon聯(lián)合推出RNAseq加速分析方案

發(fā)布時(shí)間:2023-09-20

瀏覽次數(shù):0

dnastar序列比對_序列比對軟件_序列比對結(jié)果如何分析

PART.1背景

即通過聯(lián)發(fā)科定量測序技術(shù)的轉(zhuǎn)錄組測序分析技術(shù),作為研究RNA表達(dá)水平和不同基因表達(dá)情況的應(yīng)用,在過去的十年里得到了迅速的發(fā)展。 如今,它在轉(zhuǎn)錄本變異檢測、基因融合測量、選擇性剪接測量等場景中得到了大規(guī)模應(yīng)用。 轉(zhuǎn)錄本變異檢查是指將樣本RNA序列與參考基因組的相應(yīng)序列進(jìn)行比較,以發(fā)現(xiàn)單核苷酸多態(tài)性和小片段的插入缺口。 結(jié)果主要用于確定治療部位或識別性狀。 研究。 融合基因是指兩個(gè)或多個(gè)基因首尾相連,置于同一組調(diào)控序列的控制下,形成嵌合基因。 表達(dá)產(chǎn)物是融合蛋白。 在個(gè)體疾病中,融合基因的測量已成為重要的檢測指標(biāo)。

在數(shù)據(jù)分析方面,經(jīng)過多年的探索和沉淀,行業(yè)針對不同的應(yīng)用逐漸形成了相應(yīng)的主流分析解決方案。 其中STAR作為經(jīng)典的比對軟件,已廣泛應(yīng)用于科學(xué)研究和臨床RNA測序數(shù)據(jù)分析。 與同樣經(jīng)典的AND相比,STAR具有更高的uniq比,并且對較低(包括更軟和錯(cuò)配的核苷酸)比較具有更高的容忍度,使其適合更復(fù)雜的分析需求。 因此,STAR 已成為 分析工作流程最佳實(shí)踐的黃金標(biāo)準(zhǔn)。 此外,還結(jié)合使用突變檢查、定量分析、融合測量等其他分析模塊。

然而,這種開源軟件的一個(gè)主要問題是速度慢、耗時(shí)長。 為了克服這一缺點(diǎn),三鑫軟件公司開發(fā)了相應(yīng)的加速模塊,包括用于比對步驟的STAR、重復(fù)數(shù)據(jù)刪除模塊、RNA處理模塊和突變檢查模塊,以縮短分析過程的持續(xù)時(shí)間。

但從加速分析模塊到針對特定臨床研究環(huán)境的分析流程還有很長的路要走。 因此,我們與富君基因和納巖科技合作,共同構(gòu)建了一個(gè)分析流程,使用標(biāo)準(zhǔn)產(chǎn)品或真實(shí)臨床樣本產(chǎn)生的數(shù)據(jù)。 對STAR在RNA變異檢測、基因表達(dá)定量和融合基因檢測方面的性能進(jìn)行評估,并與開源流程進(jìn)行比較,為業(yè)界選擇分析流程提供更真實(shí)的數(shù)據(jù)參考。

PART.2RNA突變檢查

RNA變異(SNP和Indel)測量的重要性逐漸被您認(rèn)識到。 與DNA突變相比,RNA突變對于異常蛋白質(zhì)的產(chǎn)生具有更直接的意義,因此它們的臨床應(yīng)用開始被大家所接受。 相比之下,加速分析的重要性也顯現(xiàn)出來,因?yàn)樗苯雨P(guān)系到受試者能否及時(shí)獲得準(zhǔn)確的檢測結(jié)果。

與DNA變異檢查類似,RNA變異檢查流程也遵循業(yè)界金標(biāo)準(zhǔn)GATK流程,包括STAR比對、去重、處理、Indel重復(fù)比對(可選)、BQSR、最終突變檢查等多個(gè)步驟。 在本次流程搭建中,我們使用了新開發(fā)的STAR加速模塊,配合其他可用的加速模塊,完成了整個(gè)RNA變異檢測流程的搭建。

序列比對軟件_序列比對結(jié)果如何分析_dnastar序列比對

我們選擇了2個(gè)樣本進(jìn)行性能測試,運(yùn)行了包括原始STAR(版本2.7.8a)和GATK(版本4.2.0)在內(nèi)的最佳實(shí)踐流程,并給予相同數(shù)量的線程再次運(yùn)行構(gòu)建的流程。 然后進(jìn)行速率和一致性比較。 從速度上來說,各個(gè)模塊的速度是比較顯著的。 兩個(gè)樣品整個(gè)過程的速度分別是6.6倍和23.9倍。 兩種工藝的一致性在98.6-98.8%左右。 主要差異來自 GATK 版本號的不匹配。

PART.3RNA定量與基因融合

對于基因定量,合作伙伴使用 SIRV 樣本作為測試樣本。 SIRV基因是該公司人工合成的7個(gè)基因。 每個(gè)基因有多個(gè)轉(zhuǎn)錄本,共有69個(gè)轉(zhuǎn)錄本。 它可用于測量交變剪切波并用作定量內(nèi)參。 在這份轉(zhuǎn)錄數(shù)據(jù)中,選擇了20個(gè)不同起始摩爾量的樣品,分別與原始STAR和STAR進(jìn)行比較,然后用于定量。 實(shí)驗(yàn)中總共對轉(zhuǎn)錄本進(jìn)行了定量dnastar序列比對,與STAR過程的定量結(jié)果完全一致。 由于這類樣本的數(shù)據(jù)量較小,STAR在定量過程中所占比例并不大,因此加速效果不是很顯著。

此外,合作伙伴還構(gòu)建并測量了基因融合過程。 所用參考標(biāo)準(zhǔn)品()含有16個(gè)已確認(rèn)的基因融合風(fēng)暴,按照不同比例與陽性樣本混合,生成5個(gè)樣本(目標(biāo)產(chǎn)量)。 0.23%-50%)作為評價(jià)樣品。 流程上dnastar序列比對,測試用STAR代替原來的STAR進(jìn)行測試,并與原來的版本進(jìn)行比較。 從結(jié)果來看,由于測試的STAR-中的STAR版本(2.7.2b)與STAR的匹配版本(2.7.8a)不同,因此兩個(gè)過程的檢出率和特異性也略有不同。 總的來說,該工藝在PPV上性能較好,但在PPV上稍低。

序列比對軟件_序列比對結(jié)果如何分析_dnastar序列比對

第四部分總結(jié)

在本次三方合作中,團(tuán)隊(duì)提供模塊組件,富君團(tuán)隊(duì)搭建并測試了RNA變異檢測流程,納花清團(tuán)隊(duì)負(fù)責(zé)RNA定量和基因融合的相關(guān)部分。 通過真實(shí)的數(shù)據(jù)評估,我們用數(shù)據(jù)展示了該工藝在三種不同應(yīng)用中的性能提升,希望為業(yè)界選擇合適的分析工藝提供參考。

如有侵權(quán)請聯(lián)系刪除!

13262879759

微信二維碼