文獻閱讀:RNAseq在臨床應用的可能和挑戰(下)

原始論文:Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., & Craig, D. W. (2016). Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics, 17(5), 257–271. doi:10.1038/nrg.2016.10

 

論文的最後,談到這些新科技如何整合進臨床之中

第一個重點就是“新的檢測(這邊指得當然就是RNAseq)”,要能變成現行臨床工作的一部份,需要符合許多特性,可以由三個層面一步步來看,分別是Analytical validity (檢測本身的效力)、Clinical validity(臨床上的檢測能力)、Clinical utility(對於最終的臨床決策的貢獻度)。

第一步:Analytical validity

相對於實驗室裡的檢測,處理的檢體都是在control condition下,所以要能讓每一次的實驗都能reproducible的技術門檻就比較低,對比於臨床簡體的複雜性,還要能在此狀況下維持檢驗的穩定性、感測極限等等,就是第一關的重要門檻,要能在有良好的檢測標準來提供檢測sensitivity、specificity的驗證,再來是每次重複的結果應該要相似的(reproducibility),不會因為微小的變數造成數值的大波動。(robustness),如前exosome的研究便是因為其容易波動而造成無法定量。

以RNAseq來看,撇開前製定序所花的不算,光後端的分析方式、參數的差異,就會造成結果有所不同,在2013年,Genetic European Variant in Disease consortium為了解決這問題設計了一組實驗來處理這些technical reproducibility和feasible的問題,收集了465個人的lymphoblastoid cell,在七個定序中心分別執行,最後總結了一些在後端上可以用來驗證定序結果的,像是GC content、fragment size、transcript length、percentage of reads mapped to annotated exon (這部分可以參考所謂的annotation QC)。除此之外,由FDA領頭的SEQC studyABRF study也有大量研究為了解決和提出相關標準。

Su, Z. et al. A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control Consortium. Nat. Biotechnol. 32, 903–914 (2014).

Li, S. et al. Multi-platform assessment of transcriptome profiling using RNA-seq in the ABRF next-generation sequencing study. Nat. Biotechnol. 32, 915–925 (2014).

 

第二步: Clinical validity

當檢測技術能在臨床檢體上保持者可重複性時,接下來檢測就要達成可以實際區分biological difference的區別力。

第三步: Clinical utility

當前兩部都達成後,再來要看這個檢驗的結果能如何改變治療,如同companion diagnostic等等,通常此時就需要setup 臨床的試驗,來看實際在臨床場域中的效果!

screenshot.png

 

除此之外,FDA也有針對RNAseq為主的檢測項目做出一些法規的架構,可以由此深入看美國FDA對於NGS技術延生的檢測所抱持的想法

US Department of Health & Human Services. Center for Devices and Radiological Health. FDA notification and medical device reporting for laboratory developed tests (LDTs) — draft guidance. [online]  (2014).

US Department of Health & Human Services. Center for Devices and Radiological Health. Framework for regulatory oversight of laboratory developed tests (LDTs) — draft guidance. [online]  (2014)

US Department of Health & Human Services. Optimizing FDA’ s regulatory oversight of next generation sequencing diagnostic tests — preliminary discussion paper. [online]  (2014).

Evans, B. J., Burke, W. & Jarvik, G. P. The FDA and genomic tests—getting regulation right. N. Engl. J. Med. 372, 2258–2264 (2015).

 

文獻閱讀:RNAseq在臨床應用的可能和挑戰(中)

原始論文:Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., & Craig, D. W. (2016). Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics, 17(5), 257–271. doi:10.1038/nrg.2016.10

文獻閱讀:RNAseq在臨床應用的可能和挑戰(中)

承襲上篇閱讀的內容,這邊談到論文的第二部分,即如何應用RNA sequencing於感染性疾病:

 可將RNAsequencing用來作為RNA-based相關病原體的診斷使用

目前臨床上重要的RNA virus如愛滋病(HIV)、伊波拉病毒(Ebola)、登革熱(Dengue)、肝炎(Hepatitis) 、流行性感冒等在醫院裡面都是使用qRT-PCR assay作為檢驗工具,這些都有可能在未來可直接用RNAsequencing來取代,除此之外,也可以用來追蹤某個疫情的爆發,像2014年的伊波拉病毒大爆發,便是使用amplicon sequencing的技術來追蹤

用來診斷傳統培養方式難以確診的細菌感染

一部份的感染疾病,其感染部位的不可性,再加上感染的細菌量少,用培養的方式通常要很久,且不一定正確,如臨床上腦膜炎的感染,確診的話會需要抽脊髓液且不一定能培養出東西,要是能從病人血液中檢驗到少許病原體的RNA便能解決,畢竟抽脊髓液本身在臨床處置上是很侵入式的,另一方面,如Mycobacterium tuberculosis的診斷用傳統方式會有問題,使用 RNAseq來提早確診外(這類細菌培養的時間都非常長,甚至幾週),也能從其transcriptome來判斷其抗藥性。

但目前來說,相對於傳統的 qt-PCR assay,使用RNAsequence在傳統的實驗中會有很大的分佈統計上的問題!

文獻閱讀:RNAseq在臨床應用的可能和挑戰(上)

原始論文:Byron, S. A., Van Keuren-Jensen, K. R., Engelthaler, D. M., Carpten, J. D., & Craig, D. W. (2016). Translating RNA sequencing into clinical diagnostics: opportunities and challenges. Nature Reviews Genetics, 17(5), 257–271. doi:10.1038/nrg.2016.10

screenshot.png

篇文章Translating RNA sequencing into clinical diagnostics: opportunities and challenges,鉅細彌遺地把RNAsequencing的應用與相關的疾病相連結,並且闡述其在臨床上的潛力,其主要分三大部分來談論RNAseq,第一部分先講利用RNAseq可以探討用來看哪些東西(轉錄變異transcript variant、non-codingRNA等),第二部份則是針對RNAseq在感染疾病的診斷和追蹤的應用,第三部份則是談論將RNAseq技術實際整合進目前的臨床情境中可能面臨的validation和法規問題。

 第一部分介紹從RNAseq可以用來看各式aberrant transcription

  • mRNA expression profile是最基本用RNAsequencing想看的,而其在臨床上實際的應用相對於DNAsequencing 可以有更多的空間,因為其可以看到動態的基因表現狀況,可用來監測、診斷疾病的狀態,如OncotypeDx 21-gene expression assay,其可以用在乳癌病患之基因檢測,用來預測癌細胞切除手術後復發的機率,或是化療及放射線治療的反應、AlloMap則是用來看心臟移植病患的急性細胞排斥,這項基因檢測服務非常完整,其臨床試驗結果還發表在NEJM上,主要使用11個基因作為signature來預測風險,收受檢體後2-3個工作天就有報告,除此之外,其他基因檢測如免疫系統的監測Adaptive Biotechnology,其主要看T-cell receptor的變異,不過也自己研發用來分析RNAseq的分析工具immunoSEQ。(雖然上述公司所發展的基因檢測商品並非直接使用RNAseq)
  • gene fusion所造成的transcripts異常,可用來區分癌細胞的subtype,不過最常見得還是在血液疾病,其中急性骨髓白血病(AML)最具有代表性,其在t(8;21)(q22;q22) translocation造成的AML1-ETO嵌合,在攝護腺癌細胞中也發現有TMPRSS2-ERG的嵌合現象,跟疾病預後相關。
  • alternative transcripts(由splicing或是structural variant造成)在發育疾病、神經退化疾病或是癌症中有角色存在,如AR-V7在頑固型攝護腺癌、EGFRvIII在glioblastoma、乳癌的BRCA1/BRCA2。
  • 特殊的RNA種類隨者技術的改善和推陳出新,開始有人研究nc-RNA或是extracelluar RNA在疾病中可用來診斷的機會。
    • extracellular RNA 是在biofluid中的胞外RNA,其被體內細胞分泌出後由extracellular vesicles 或是RNA-binding protein及lipoprotein。去量測exRNA的好處是其可以由血液中獲取(及最近很火俗稱的blood biopsy),但其lack of tissue specificity是目前的問題所在,因為所有的細胞都可能分泌出exRNA,而目前有科學家使用抽取特定組織間液的方式來解決這問題。而exRNA可以用來檢測或是追蹤癌症進展,ExoDx Lung 是今天2016年一月發表的商業基因檢測商品,其可以由血液檢體中檢測肺癌病人是否有EML4-ALK fusion transcripts或是T790M。

第二部分則介紹將RNAseq使用在感染疾病的追蹤、診斷上,如RNA-virus相關的疾病登革熱、A肝、D肝、SARS等等,在感染疾病的追蹤上則可以利用RNAseq來做metagenomic的應用,看是哪種type的感染或是其可能的傳播路徑。

第三部份則是介紹實際將RNAseq導入臨床應用,撇開本身實驗及分析RNAseq結果的困難度外,最重要的是相關法規,如執行RNAseq的醫院實驗室要怎麼管理和通過驗證,都算有其難度。

The New Reddit Journal of Science

 

screenshot.pngReddit網站是美國鄉民重要聚集地,從2005年創立至今,裡面有各種最道地的話題包含娛樂、社交媒體、各式各樣,而reddit裡頭會有各個不同的subreddit,裡頭討論者不同的主題,而有一種形式的subreddit是非常熱門的,讓名人直接開版,讓鄉民問問題,分別是IAmA 或是 AMA (ask me anything)series,連歐巴馬總統也有開版回答中鄉民的問題,是其中有一系列有趣的專欄是專屬於科學宅的,那便是The New Reddit Journal of Science裡的AMA series

在這個系列中,論壇會邀請各個生醫領域“大老級”的人物直接在論壇中跟鄉民們互動,比如前陣子有Francis Collins(NIH Director, Human Genome Project director),The Cancer Genome Altas (TCGA) director Jean Claude Zenklusen 等等,在這邊獲得的資訊非常的多樣,且在論壇的右邊也會公告資訊說接下來哪個時段會有什麼科學家來駐版:

screenshot.png

所以有遇到自己喜愛的科學家,在特定的時間便能提出問題,即時地互動,且有的section會先票選問題,讓好的問題在那段時間內能被科學家回答,畢竟茫茫鄉民,不一定總是問好問題!

如何組織每次的分析專案檔案

每一次的資料分析,都會產生大量各式檔案,有原始資料、前處理過的、分析的程式碼,所以多花點心思在每個步驟都稍微整理回顧一下,長久來說會減少很多“災難”,讓自己能有reproducible research skill. (其實就算是wet實驗也都是如此,只是dry的分析,幾乎都在電腦上,所以好的習慣變得很重要)。

論壇上其實有不少人也有這樣的問題,故整理一些不錯的文章,雖然每一個人的做法些許不同,但重點是要建立自己一套流程。

screenshot.png

第一個重點是以project為單位來整理,不要用時間或是分散式的,所有跟某一次實驗或是分析相關的就用一組架構,架構裡最主要就分三類:資料、分析結果、分析程式碼,也是根據這三類來分,另外,可以用subproject來往下。而可以多多利用command line的技巧來減緩創建資料夾的麻煩(使用wild card),而在README文件要有良好的documentation,且可以用純文字撰寫,但可以用markdown的風格撰寫,可以在使用工具轉換成pdf、doc,使用像是pandoc的工具。

主要多花時間整理自己電腦裡的資料,整體分析的工作流程會進步更快,雖然一開始在資料量少的時候會比較煩!之後再分享用git來做版本控制!