飢餓與長壽:科學家Valter Longo

二十年前研究長壽是一個很瘋狂的概念,如今卻有許多公司以此為目標,比如科學家Craig venter成立的Human Longevity公司,而這位科學家Valter Longo便是在二十年前就從酵母菌為工具,開始探索這個主題。如此,長壽或者老化隨者高齡化時代的來臨,逐漸變成一個重要議題,當然,相關的研究也開始被主流接受,仔細看Valter Longo的研究,算是非常的有意思。

Valter Longo教授,本身是義大利人,到美國求學,本來想成為音樂人,但陰錯陽差鑽入了生化領域,這篇訪談文章Interview with Professor Valter Longo,可以以覽他過去的走的路,其實從某一方面講,蠻特立獨行的,最令我有興趣的是,他還成立組織,販售一種FMD(Fasting Mimic Diet),藉由特殊的營養組成,來模仿身體飢餓的狀態,這算是我蠻欣賞的勇氣,用實際的行動來驗證自己過去的研究,雖然還有許多證據需要累積,但這算是讓人可以嘗試的一個路徑,研究本身除了滿足好奇心外,要是能應用到生活,是多棒的事情呀!當然,談論各種另類飲食療法的人相當多,但要能發表各種嚴謹研究來支持的人卻是少數。

致敬科學家Sydney Brenner

分子生物學家Syndey Brenner在2019年4月5號在新加坡過世,這位科學家在2002年獲得諾貝爾生醫獎,其以線蟲作為模式生物,在細胞凋亡和發育上的研究獲得肯定。

Photo from Nature, https://www.nature.com/articles/d41586-019-01097-7, Credit: Andrew Cutraro/Redux/eyevine

在閱讀這篇關於調控網絡的文獻(1),意外看到他的名字,發現了一篇在2008年訪問他的文章,刊登在Nature Review的Molecular Cell Biology上,訪談的內容有許多他個人對於現今研究的觀點和看法,頗具批判性的。

I prefer to see outstanding MDs go into the clinic and train to do research there.

…generating an effective bedside to bench approach is going to require major adjustments in medical education. We will need to introduce more basic science into the medical school curriculum

他過去的研究開啟了分子生物學很多知識的源頭,比如三個DNA代碼,對應一個氨基酸,或是RNA分子是如何讓核糖體製造出蛋白質的,以及發展使用線蟲作為模式生物,來進行研究的方法學。

他在劍橋大學時,跟DNA雙股螺旋結構的發現者Francis Crick在同一個研究室大約20年,能激發思考和討論的環境下,真的是件很幸福的事情。他們兩個在這段時光中奠定了許多分子生物學的機制基礎。

閱讀參考:

  1. Celine Lefebvre, G. R., Andrea Califano. (2012). Reverse-engineering human regulatory networks. Wiley Interdiscip Rev Syst Biol Med. doi:10.1002/wsbm.1159

論文閱讀:Machine Learning in Medicine

跟之前撰寫的另一篇文章機器學習在實驗室醫學的應用中,這一篇刊登在新英格蘭雜誌的文章,算是由黃金陣容提出的看法,通訊作者Isaac Kohane是美國哈佛大學醫療資訊的資深教授,另一個,Jeffrey Dean則是google brain的負責人,這兩個人在醫療和資訊領域分別佔有重要的角色,讓這篇文章格外引人注目。在這集的文章中,還有編輯和通訊作者Issac Kohane的訪談和一隻影片,文章的內容算是精實。

本篇文章分成幾個部分:

  • 簡介:醫療場域的問題和機器學習可以給予的解法
  • 解釋機器學習的定義 Machine Learning Explained
  • 機器學習在臨床場域中的應用How Machine Learning Can Augment the Work of Clinicians
    • 預後Prognosis
    • 診斷Diagnosis
    • 治療Treatment
    • 臨床工作流Clinician workflow
    • 擴大臨床專家的可近性Expanding the availability of clinical expertise
  • 重要挑戰 Key challenges
    • 高品質的資料 Availability of high-quality data
    • 在使用模型中可能的問題Learning from undesirable past practices
    • 法律規範和安全監管Expertise in regulation, oversight, and safe use
    • 發表的模式Publications and dissemination of research
  • 結論 Conclusion

醫療場域中常見的問題是病人往往需要多處去詢問,以便能轉診給特定問題的專家,來處理他的問題,假如可以讓病人更容易地獲得這些專家們的經驗,在單一次的診察中獲得,或是讓基層醫師能獲得醫學中心特定領域的經驗支持,那這樣可以改善目前這些常見的困擾,而機器學習便是一個可以發揮作用的科技。

機器學習的重點在於用演算法是基於資料或是案例,而非寫好的規則(rule-based),在這前提下,其實機器學習是個包含很廣的,裡頭很多方法都是從統計學而來的,只是加上資訊工程。(推薦這本Computer Age Statistical Inference,裡頭有蠻多統計學家對於這些事物的看法。)

There is no bright line between machine-learning models and traditional statistical models. However, sophisticated new machine-learning models are well suited to learn from the complex and heterogeneous kinds of data that are generated from modern clinical care, such as medical notes entered by physicians, medical images, continuous monitoring data from sensors, and genomic data to help make medically relevant predictions.

如何使用機器學習?

機器學習是個大概念,裡面有許多不同的模型,所以重點就變成要根據資料的特性來挑選適合的算法,以便達到理想的結果。

這過程可以分成大部分:1. 定義清楚這模型要完成的任務和目標 2. 模型的訓練方式 3. 如何評估這個模型。

這篇有提到的一些有趣的想法:

  • 臨床流程的改善
  • 病人主導的資料應用系統(Patient-controlled application programming interface)
  • 擴增臨床人員的技能
  • 相關的規範和品管
  • 如何讓這領域的發表能更容易讓醫療領域的研究人員觸及

這篇文章裡面可以看到蠻多Isaac Kohane教授過去所推動的蠻多概念,比如統一的醫療資訊交換系統FHIR,或者是病患為主的應用介面,或是應用程式如何改善傳統的醫療流程等等問題。

書籍閱讀:科學之路 The Art of Scientific Investigation (一)

會接觸到這本書,其實是搜尋到台大莊榮輝教授(目前已退休,轉任台科大)的網頁,算是從高中就開始看他準備的網頁資訊(研究生涯),從今日的觀點來看,依舊是非常棒的東西,還好台灣還有這些充滿熱情的教師,在努力散步學習的熱忱,話說回來,這本書是英國劍橋大學 病理學教授William Ian Beardmore Beveridge的書,寫於1950年,時至今日,依舊能帶給人許多的啟發,某些共通性的事物,總是不變的。

The lame in the path outstrip the swift who wander from it

Francis Bacon

不得不驚訝,原來經過快七十年的時光,人類如何努力獲得知識這件事,在觀念上依舊是如此相通。這本書的架構如下:

  • 準備工作
  • 實驗
  • 機遇
  • 假設
  • 想像力
  • 直覺
  • 推理
  • 觀察
  • 困難
  • 戰略與戰術
  • 科學家

在第一章準備工作裡面,提到科學工作者(對應到今日,可以廣泛稱知識工作者或許更為恰當,不一定只有科學家才必須如此),必須抱有終身學習的態度。

盡興書,不如無書

簡單來說,大量的閱讀,不必然代表能給予你做出新研究的能力,因為你閱讀的資料可能提供錯誤的想法,所以為了避免這個結果,大量閱讀必須放在擁有批判性思考的前提下,才對你的智識成長有幫助,否則反而會侷限住你對於問題的想法,在當時後的時代背景,閱讀完所有期刊論文已經是困難挑戰了(哇靠!七十年前就這樣了,那現在不就是整個很崩潰,可見資訊爆炸對於人類算是個古老的問題了),當時候的研究者,會把閱讀所花的時間根據精讀的程度來做分類,這部分也許之後分享約翰霍普金斯統計學家Jeffrey Leek的書How to be a modern scientist時,更近一步分享。

培養廣泛的興趣

這點緊扣著前面所說的,盡信書,不如無書,更近一步,作者提到很多重大科學的發現,往往不是由原本領域的人所提出,而是由outsider所提出的,因為outsider不會被既定的觀念和想法所限制,又能帶入其他領域的觀點,那如何培養這樣的觀點,那就是抱持者廣泛的興趣。

從問題出發

實際開始著手一個科學研究時,最好是從問題出發,比如做動物感染研究,那麼不要害怕去接觸農場的工人,往往會發現更有趣的題目,從問題出發的重點是在把收集的相關文獻,客觀地評估其對於這問題的貢獻和提出的想法,藉此找出還沒有回答的部分,再以此作為研究的方向。

與其學知識,不如學方法

這邊有提到,過去往往強調讀通教科書的重要性(這部分可能深植於華人教育),但作者強調多去學習一些方法學的東西,如統計學和數學,或許幫助更大,因為教科書的內容往往會刪去許多細節,以創造合理性,這部分除非直接閱讀出處的研究,否則很容易就會失去批判性,這部分讓我想到之前讀醫學院的時候,教授往往說你這時候讀的醫學知識,可能五年後就不適用了,如今真的是稍有體會到,學方法比學知識本身更重要。

閱讀巨人的過去

閱讀成功科學家的歷史多少能給自己一些觀點(也許有倖存者偏差存在),但實際上還是能給予一個人對於生涯選擇的想法,最後的重點便是跟隨者自己的興趣,如此來形塑一個人的特色。

探索英文科學寫作:AMA, MLA, APA差異在哪?

寫作能力可以說是一個人一輩子最重要的技能之一,而寫作又因目的和閱讀者的不同有各種寫法,其中科學寫作或是說學術寫作算是對研究者來說很重要的一類活動,科學寫作最重要的特色便是引用前人的著作,所以理解如何引用,或是引用的寫法變很重要。

引用(citation)之目的是讓閱讀者能回朔你所引用的文章,一篇文章會有標題、作者、發表日期、刊登出處、出版社、所在刊物的頁數等等,所以排列順利和要列上些什麼,就必須要有一套良好的規範,避免混亂,其中最常見的引用格式有:

  • APA(從心理學、社會科學領域到其他領域都有使用)
  • MLA
  • Chicago(人文領域)
  • Harvard (用在經濟學領域)
  • AMA

這些規範會分成兩部分依據其陳列在文章中的部分,分別是內文引用(In-text citation)和文獻列表(literature list)。在內文引用部分主要有三大類寫法:Author-date system(寫引用文章的作者和日期), Numerical system(編號所有文章中的引用,並且冠上數字), Notation systems(上標數字在內文中引用出現處)。

格式 領域 系統 文獻引用方式
APA 社會科學 Author-date Author, A. A., Author, B. B., & Author, C. C. (Year). Title of article. Title of Periodical, volume number(issue number), pages. https://doi.org/xx.xxx/yyyy
Harvard 經濟學領域 Author-date Author, A. A., Author, B. B., & Author, C. C. (Year). Title of article. Title of Periodical. Location
MLA 人文科學 Author-page number Author, A. A., Author, B. B., & Author, C. C. Title of article. Title of Periodical. Year
AMA 生物醫學 Numeric Author, A. A., Author, B. B., & Author, C. C. Title of article. Title of Periodical. Year. volume(issue):pages
Chicago 人文科學 Notation/Author-date Author, A. A., Author, B. B., & Author, C. C. (Year) .Title of article. Title of Periodical. volume(issue):pages. doi:xxx.yyy/xxxx.12222.

基本上,各種引用格式針對不同的發表形式,多少會有不同的引用規格,近一步來說,各個期刊也會有不同的規定細節,所以關鍵是去理解和留心自己是如何撰寫這些引用,以及是要把文章發表在哪,而去決定這些細節。

閱讀資源:

Harvard Writing Center
Purdue Writing Center
部落格文章:學術寫作必備工具書
Scribbr:Citation styles guide | which citation style to use?
Cite This Form


探索資料庫:PMC 和 Pubmed有什麼不一樣?

現在最常找文獻的方式,其實就是直接古狗(google)有興趣的詞彙,期待google大神丟給我幾篇大作,其中點進去往往會跑到PMC或是Pubmed的網站,雖然兩個都是在NIH下的,但兩者查到的東西都不太同,那到底有什麼不同呢?

這篇文章可以非常好的回答這個問題:

MEDLINE, PubMed, and PMC: How are they different?

談到PubMed和PMC,也需要提及MEDLINE,因為它們算是有時代關聯的產物,MEDLINE是最早的美國國家生醫文獻資料庫,在1960年代就有,收錄的文獻都有相當完整的編碼,採用MeSH字彙來整理,所以用自然語言或是相關語義搜索的話,能有比較完整且精準的查找能力,但其收錄的文獻相對就少,畢竟需要手工人力去對這些文獻做索引,或是依賴發表者的提交,為了應付文獻快速的飛長,Pubmed的資料庫便在1996年出現,他除了包含了MEDLINE資料庫的內容外,還包括了還未經過索引的文獻,以及相關的引用資料,隨者開源閱讀和免費全文的趨勢,PMC資料庫在2000年出現,主打收錄的文獻都是提供全文閱讀的,有了上述的概念,便知道說,要找資料時,根據你的搜尋策略和目的,便可以有不同的入口。

下面則是原文針對PubMed的收錄原則,有興趣的話可以看一下。節錄台大圖書館的網站文章

1. 處理中的文章,此類文章尚未由專業館員加上MeSH,亦尚未收錄於MEDLINE。
2. MEDLINE收錄的期刊中,不屬於MEDLINE收錄範圍的文章 (例如載於基礎科學期刊裡的板塊構造、天體物理學文章),此類期刊如果有刊載生命科學相關主題的文章,會標註MeSH。
3. 尚未正式發表的期刊文章,此類文章通常是出版社經由電子方式提交給NLM。
4. 部分尚未更新為近代MeSH辭彙(1966年以前),且尚未收錄於MEDLINE之OLDMEDLINE資料。
5. 在MEDLINE收錄範圍之外的生命科學領域期刊,如果有提交電子全文予PubMedCentral且經過NLM審核,即可在PubMed上查得。
6. 美國國家衛生研究院 (National Institutes of Health,簡稱NIH)資助之研究者所發表的文章。
7. 收錄於美國國家生物技術資訊中心 (National Center for Biotechnology Information,簡稱NCBI) BookShelf上的大部份圖書。

這裡面真的藏滿人類的珍寶智慧啊xd

閱讀參考:

台大圖書館 MELINE與PubMed差異比較

知乎:PubMed, PMC和MEDLINE的區別和聯繫

機器學習在實驗室醫學的現況

先不管人工智慧這詞在這兩年如何延燒,本質上,都只是人類科技的漸進式進步,每一個之間都有脈絡相連,從所謂的統計分析、大數據、機器學習、深度學習到人工智慧,但媒體為了方便讓門外之人來稍微理解,才需要如此用Buzz word下標。

駐:這篇以此文章的角度訴說,其實我的想法中,機器學習只是一個演算法工具,用來作一些預測、分類、判斷。

這邊分享一篇2019三月在AACC裡的一篇新聞式的文章,開頭就是:
Machine Learning and Laboratory Medicine: Now and the Road Ahead,作者是Thomas Durant醫師,目前耶魯大學檢驗醫學的研究醫師,從作者的年紀和談論的主題,可以發現新的一批年輕醫師開始將其他領域的知識引入實驗醫學,這算是一個蠻令人振奮的氛圍,如同長庚醫院檢驗醫學的王信堯醫師最近用機器學習開發的抗藥性菌株辨識演算法,也大大改變了如今臨床上的資料取得的速度。

閱讀完這篇文章後,可以發現其寫作對象應該是其他的檢驗醫學醫師,內容沒有在技術細節琢磨太多,反而在談論檢驗醫學科的醫師如何將機器學習中引入實驗室醫學的角色,甚至帶入臨床場域的角色。

這篇文章主要可以分成三部分:

  • 1. 簡介
  • 2. 機器學習目前在醫院檢驗室內和外的使用狀況
  • 3. 在引入臨床中會遇到的困境

簡介:機器學習足夠成熟和穩定

通常醫院環境是相對保守的地方,可以從其嚴謹的規範看得出來,所有與病人相關的處置,通常都需要經過足夠的臨床試驗和證據支持,才能在醫院內推行,其中醫院檢驗室內的規範,算是其中之最,有許多實驗室的認證需要完成,因為每個檢驗數值都攸關病人的臨床決策和治療,所以導入任何新技術都需要驗證,即使是常規的檢驗方法都有品管在嚴格監測,所以機器學習這技術要導入,必定代表其在其他領域有一定的成熟度,這點可以從每日的新聞和許多身邊的電子器材中感受到,所以如今等待者檢驗醫學的醫師找到一套比較好的方法去導入這技術到檢驗室中,同樣地需要為其找到良好的評估和驗證的方法,這也是導入機器學習於醫院中的第一層挑戰。

機器學習的應用在醫院檢驗室內以及外

這篇所謂的醫院檢驗室內與外,是在用臨床環節來思考和區分的,這邊的臨床環節是指從病人檢體送到檢驗科,檢驗科發出報告,臨床醫師閱讀報告來做臨床治療,這一個流程中,在報告抵達各科臨床醫師前和後中,機器學習如何落地其中,在檢驗科內部,目前有些已經核准的產品如Cellavision, Accelerate Pheno(相關論文/)。

來自Marta Veses-Garcia…etc. Rapid Phenotypic Antibiotic Susceptibility Testing of Uropathogens Using Optical Signal Analysis on the Nanowell Slide. Frontiers in Microbiology. 10 July 2018

Clinical pathologist suited for the role to guide these types of efforts, owing not only to ML models frequent reliance on laboratory data but also laboratorians’ expertise in validating new technology for clinical purpose

節錄自此篇文章

在實驗室外,則是整合在電子病歷(Electrionic Health Record, EHR)裡頭結合檢驗數值來做臨床決策的工具(Clinical Decision Support, CDS),這部分則需要有更多相關的規範指引,在2017年美國FDA有發表一個關於臨床決策支持系統(CDS)軟體的規範草稿,這部份可能要等到規範正式後,才比較容易合法的發展。

引入臨床中會遇到的困境

將這些技術引入到臨床中,會遭遇到的問題主要有:1. 資料處理的問題 2. 模型的可概括性 3. 相關規範 4. 臨床醫師的接受度。 這幾個問題,目前都沒有很好的解決辦法,不過這也代表的機會。

Laboratory medicine professionals will need to understand what can be done reliably with the technology, what the pitfalls are, and to establish what constitutes best practices as we introduce ML models into clinical workflows.

節錄自此篇文章

書籍閱讀Genomics: A Very Short Introduction

Genomics: A Very Short Introduction

這本書是最近發現的,為牛津出版社通識系列A Very Shorty Introduction 中,生物醫學領域針對基因體的簡介,因為還沒有中文譯本,我自己覺得稱呼其 簡談基因體:過去、現在和未,這名字應該蠻適合的,這本書在去年2018年2月左右發行的。

加拿大戴爾摩斯大學(Dalhousie University)生物分子學教授約翰.阿奇博(John M. Archibald)是這本書的撰寫人,其本身為加拿大皇家科學院院士,研究領域為生物多樣性和真核生物的演化,所以書中有一大部分在談論微生物體學的相關想法,其有出版另一本書One Plus One Equals One: Symbiosis and the Evoluation of Complex life。

本書定位為入門介紹,但其內容其實部分會帶到頗當前的觀念,並不會簡單到讓人已有基礎的人失去興趣。

本書的架構大概分成七個部分:

第一部分What is genomics?
簡單定義什麼是基因體學,和關於基因的基本觀念,和為什麼定序基因序列是重要的。

第二部分How to read the book of life?
則介紹了過去、現在和未來的定序方法,從桑格定序法(sanger sequencing, chain terminator sequencing)到反向終止鍊法(Reversible chain terminator sequencing, illumina),以及目前可以用來長序列奈米孔洞定序技術(Single Molecule Sequencing),基本上,其圖示相當清楚,觀念陳述為主,不陷於技術細節。

第三部分Making sense of gene and genomes
這邊帶入了目前如何使用定序的資訊來拼裝基因體的完整資訊,並且用其來推測基因相對應的功能。

第四部分The human genome in biology and medicin
整理了從人類基因體計畫、相關基本基因的觀念、HapMap計畫、癌症計劃等等面相基因體研究對於生醫領域的方向。

第五部分Evolutionary genomics
因為本書的作者其是微生物領域的專家,這邊分享近期作為研究物種演化工具的技術和觀念,如何來評估兩個物種間發展的先後等等。

第六部分 Genomics and microbial world
這章節帶入目前蠻火紅的微生物體學的進展。

第七部分The future of genomic
談論目前嘗試用基因定序技術延伸出來做資料儲存、合成生物學和未來個人基因體時代的闡述。


書籍閱讀:Bad Blood: Secrets Lies in a Silicon Valley Startup

惡血:矽谷獨角獸的醫療騙局!深藏血液裡的祕密、謊言與金錢

對於實驗診斷學或是檢驗醫學有興趣的人,可以看這本書,從中可以獲得一些職涯的啟發,另外,這也是圍繞這職位相關的人所展開的故事。

這本書是由華爾街日報記者John Carreyrou所撰寫的,他是位做深度報導的記者,原文的文筆極好,引人入勝的撰寫方式,彷彿在看電影一般,而閱讀者就在每一幕發生的場景中,相信這本書有機會改變成電影。

惡血(Bad blood)這本書的主題是曾經為矽谷獨角獸的血液檢測公司Theranos,故事的主人翁為公司創辦人伊莉莎白.霍姆斯(Elizabeth Holmes),在進入史丹佛大學後,她進到化學工程系教授Channing R. Robertson的實驗室後,在大一升大二的暑假,開始發想做一滴血的檢測技術,從此開始創業生涯,Theranos的名字便是整合了Therapy和Diagnosis兩字的融合。

整本書的架構基本上是照者時間序列的方式來敘述這間公司的歷史,從他們發展“Edison”到"miniLab"、董事會成員間的糾紛、Theranos內部的保密風氣和對員工們填寫保密協議的執著和其法律顧問-知名David Boies律師事務所是如何無所不用其極地追蹤和壓迫其離職員、Homes是如何跟美國國防部將軍斡旋將其器材使用在阿富汗等戰場、如何跟知名連鎖藥局Walgreen和零售商Safeway談health center的合作。

  1. Elizabeth Holms是位厲害的創業者,如何在沒有“實際”成果時,能募得如此高額的投資,其如何計畫性的利用各種人脈,當然其本身具有的熱情和聰明絕對無法否認,其所挑的題目:讓人們不在懼怕抽血,可謂打中許多成就斐然,已屆高齡的權勢人物心中的想望,以此凝聚其往前推進的力量,可惜題目和野心太大,攸關人命,所以才會被如此反撲,否則很多知名的新創公司,都是和她一般變做變搞出來的。
  2. 血液檢驗行業是需要符合必要的法規和經過認證的實驗室人員才能運行的,此技術和行業在精準醫療的時代越來越重要,各式各樣的檢驗不斷在開發。
  3. 美國調查記者John Carreyrou,如何在Theranos獲得市場在一片“好評”和各種大咖政商名流支持下,撐過巨大壓力後,讓Theranos內部實際的狀況讓大家知道,當時的Theranos所擁有的財務能力是非常驚人的,獨角獸級的現金,書中對其中員工和相關人物在揭露真相時遭遇的法律威脅,有非常真的描述。
  4. 本書中對於各種人物的描述和內心揣摩恰到好處,讓讀者能感受到裡面人物在做各種決定時的壓力和掙扎。

後記,不小心看到這篇論文,算是Theranos公司在2018最後產出的論文,可以看出Channing R. Robertson教授到最後還是蠻挺Elizabeth Holmes的,相信要是Holmes不那麼地急躁想要使用在病人身上,也許會是間不錯的公司。

Marilyn B. Nourse,…,Channing R. Robertson, Elizabeth A. Holmes. Engineering of a miniaturized, robotic clinical laboratory. Bioengineering & Translational Medicine. 3: 58-70. PMID 29376134 DOI: 10.1002/btm2.10084 


最近美國的電視台出了幾部關於Therano的紀錄片,內容可以直接看到書中出現的人物接受訪問,好奇這些人的實際長相,可以觀看這些紀錄片!

HBO紀錄片版本:The Inventor: Out for Blood in Silicon Valley (2019)

ABC News版本: The Dropout