Broad Institue博德研究中心CommKit期刊系列(二):How to go about writing paper results

好的研究結果之要件
1. 清楚註明資料和結論是從哪邊來的
2. 資料的呈現能符合邏輯順序
3. 論述的過程依據take-home message來搭建

目的:
1. 清楚地且客觀地描述你是如何取得研究結果或資料
2. 根據這些資料來提供所謂的take-home message

將臆測的部分放在討論的地方

技巧
1. 將結果有邏輯地整理成幾個區段
2. 每個結果區段都有rationale, data, and a transition(唯一臆測便是用來做這個用途的)
3. 只展現需要展現的資料
4. 注意風格

參考
Broad Institue CommKit: Journal Ariticle Result
http://mitcommlab.mit.edu/broad/commkit/journal-article-results/

Broad Institue博德研究中心CommKit期刊系列(一):How to go about writing a paper

如何開始撰寫一篇論文呢?
有人會從摘要開始,有人從結論開始,也有人從緒論開始,其實怎麼撰寫都可以。

假如你不知道該從何處開始,其實可以建議從結論開始撰寫。Anecdotal evidence顯示大多數人其實發現從結果(result)開始寫會比較簡單。當結果寫完後,就可以作為一個羅盤來指引整篇論文的撰寫。

要考慮的事情?
1. 摘要(Abstract):我要如何簡單明嘹地來說明我研究的重要性呢?
2. 介紹(Introduction):什麼資料是讀者需要的,以歷來對於我的研究有所了解呢?
3. 討論(Discussion):什麼新的insights或是問題是我可以帶給讀者的,當他知道這些結論呢?
4. 方法(Methods):什麼方法是我用來取得結論的?

什麼是你這篇論文主要想傳遞的訊息或是所做的結論呢?
1. 將所有資料,依據實驗分類
2. 將所有實驗結果簡單寫下重要的結論
3. 討論這些結論之間的關聯,然後如何將其整理成有邏輯的順序
4. 將結果整理成大綱,並且思考,這樣的順序如何影響介紹(Introduction),摘要的Punchline,在討論中要提出的問題?
5. 假如你沒有被說服,嘗試重新整理你的實驗順序,再跑一次這個流程

假如你依舊對於撰寫你的想法有困難:
你可以準備一份簡單的口頭報告,來跟朋友或是同事討論,這樣簡單的一個動作可以更容易釐清你的想法和研究的邏輯。
1. 跟熟悉你研究的同事討論,他們可以幫助你調整研究結果的順序是否合乎邏輯
2. 跟非熟悉你研究的朋友討論,他們可以幫助你清晰地描述你論文的重點

關於整理的小技巧
將資料整理成圖表
1. 紀錄實驗細節
2. 將實驗以時間序列整理
3. 將結果做成圖表

維持一個好的引用資料庫
1. 使用好的軟體
2. 維持所有方法的引用
3. 持續保持一份好的引用列表

持續尋找反饋,隨者你的資料有所更新
1. 給你的同事看你的圖表
2. 詢問是否有什麼進一步的實驗可以做

在寫作開始前
確認你要為什麼而寫,每個期刊都有寫作指引,可以依據此寫作指引製作“清單”

參考
General Tips: http://mitcommlab.mit.edu/broad/commkit/general-tips/

 

End-to-End 視覺化框架工具設計:vue2+koa2+d3.js(整理中)

正在著手開發一套複雜組學資料的視覺化分析系統,將其產生的圖,用在論文中,同時,可以順便做一套生資系統,畢竟目前在處理組學分析資料,好的視覺工具不多,也因此碰觸了d3.js。

本來只用koa2+d3.js來做靜態的設計,但後來發現代碼越來越巨大,要產生的各種視覺模塊可能會更多,為了更好的解決這問題,也必須用相對應的框架和工具(雖然選擇的標準是要越簡單越好。)後來決定試試使用vue2為前端的框架。

雖然還不確定行不行得通,先收集相關的資訊來試試。

相關資料

– 整合koa+vue
全栈开发实战:用Vue2+Koa1开发完整的前后端项目(更新Koa2)

– 整合d3.js和vue2
Composing D3 Visualizations With Vue.js

整合範例Chrisv Fritz 方條圖

Vue.js で d3.jsを使う その2(svgのcircleの半径を動的に変更する)

  • vue相關的工具
    webpack
    vue-cli

書籍閱讀:Visualization Analysis & Design

visualizationAnaalysisandDesign這本書Visualization Analysis & Design是由UBC資工系教授Tamara Munzner所撰寫的,是目前視覺化領域做為教科書很好的教材,內容可以說是極盡用心,每章節最後都會附有延伸閱讀可以進一步擴展。

這本書的出現,本身就是Tamara Munzner為了解決視覺化這新興領域沒有良好架構的問題而撰寫的,其擷取許多前人的大作,從Tufte開始,作者最喜歡的是他那本Envisioning Information,但唯一的缺點是Tufte的書通常都停留在非常傳統的視覺化技術,而最近20年來,視覺化技術最重要的是想要知道如何在互動性下能讓人探索到資料中更多的未知性質。作者推薦可以搭配此書的有:

Colie Ware.(2008).Visual Thinking for Design

假如想要更深入的或是偏技術面則可以考慮下面這兩本:

Wilkinson, Leland.(2005).Grammar of Graphics

Matthew O. Ward, Georges Grinstein, Daniel Keim.(2015).Interactive Data Visualization:Foundations, Techniques, and Applications

本書總共有15章:

第一章:介紹一套分析架構來做視覺化設計,藉由提問What-Why-How和相對應的Data-Task-Idiom
第二章:介紹What,也就是資料的類型和特性
第三章(精華):分別介紹Why和How,這邊算是整本最重要的地方,把整個思考架構的大圖講解出來。
第四章:延伸這個分析架構,多加上domain situation level和algorithm
第五章:多介紹一些關於視覺編碼的原則
第六章:提供八個設計法則
第七章:介紹表格類視覺化
第八章:介紹空間資料視覺化
第九章:介紹網絡資料視覺化
第十章:介紹顏色在視覺編碼中的原則
第十一章:討論如何處理關於視覺化中“視角”的問題
第十二章:如何處理視覺化中多重視角的設計
第十三章:如何簡化資料呈現量
第十四章:如何填加附屬的資料
第十五章:用六個例子收尾

假如想快速搭建自己設計視覺化的架構,可以閱讀第一張和第三張,第二章有點惱人。
這邊分享第三章的內容:

visualization_action_whyvisualization_how

健康管理- 將疾病扼殺在搖籃裡:反人性的做法

“扼殺在搖籃裡”這詞彙蠻有意思的,不知道是否是個厘語還是某個時期的流行用語!剛好閱讀完王煜全第178講 健康管理-將疾病扼殺在搖籃裡,跟最近看到由德巴克·喬普拉(Deepak Chopra, MD)的書:超級基因(Super Genes)自癒(Healing Self),和關注的新興醫療領域(整合醫療、生活習慣療法..)等串連再一起。

在王煜全全球科技250講中第178講中的這段話

不論是學術界、政府、社會,甚至個人都知道健康管理的重要性,但是健康管理作為一個產業,尤其是比起以治療為主的專科醫療、急重症醫療,在國內發展得並不快,產業規模也不大。

那這是為什麼呢?

其實是因為,洞察和順應人性的商業一班都會成為剛需,市場巨大,但是健康管理其實有點兒反人性的,是要和人性做鬥爭的產業。

所以醫院的治病救人是順應人性的,他是剛需,所以他也會收到比較高的經濟回報,而健康管理目前的市場還比較小

上面王煜全的觀察結論很一針見血,醫學裡面談的通常都是致病後的治療,在惡性循環中,稍微矯正回正常狀態,放病人回家以後,病人依舊是照原本生活方式去過,想說只靠藥物來幫助,但事實上,生活上的調整是相當重要的,而健康的生活就是反人性,必須依靠紀律和意志力來維持的,畢竟大自然的規律就是讓亂度最大化。

也許所謂的健康管理是一個方向,代表隨者教育和經濟的進步,人們對於自我健康注重會增加,而有下面三大趨勢:

一是健美的身材、健康的飲食以及積極向上的精神狀態已經成為一種社會風尚,甚至可以代表社會地位。

二是越來越多的人喜歡通過社交媒體曬自己堅持運動、健康飲食的生活方式。

三是正念、冥想、瑜伽也成了新時尚。

如何提供工具給予願意或是想要維持健康的人能自我健康管理,相信會是未來很重要的商業領域。

 

文獻閱讀:Interpretation of biological experiments changes with evolution of the Gene Ontology and its annotation

Aurelie Tomczak, .ed .(2018).Interpretation of biological experiments changes with evolution of the Gene Ontology and its annotations. Scientific Reportsvolume 8, Article number: 5115

這篇文章談論的重點是使用基因功能資料(基因本體/Gene Ontolgoy)來分析基因群,可能因註釋版本不同會造成分析結果的變化

論點不新奇,但是論文的分析過程所使用的觀念可以學起來,作為一種基因富集分析的“品質確認”,用來知道自己的實驗結果,在此分析下找到顯著的基因功能,是否有偏差。(這部分的觀念應該還沒有,該如何做生資分析的quality control?)

從此篇論文可以學習的觀念有:
1. 如何做一致性分析(consistency calculation),使用Jaccard Index。
2. 利用資訊熵分數(Information Content score)來評估一個基因本體的字元(term)其使用頻率和資訊有鑑別度的比率。

此篇論文中所包含的實用知識有:
1. 目前Gene Ontology裡面註釋字彙(annotation term)的消長
2. 在Gene Onotology中有被註釋到和沒被註釋到的基因比例變化

這篇論文使用MetaSignature的104個基因集作為分析的基礎來探討這些基因集拿來做基因富集分析,在不同版本的Gene Ontology下所造成的結果差異。

screenshot.png

此篇論文起手式來分析其不同版本GO註釋資料的差異,從2004到2015年,單一基因被註釋的比例,完全沒有被註釋到的基因數百分比從66.6%到35%,另外,被研究比較多的基因,的確其增加的GO term注釋是提供更多更精準之資訊。

screenshot.png

這張圖則是顯示了不同所謂顯著的GO term隨者不同版本,其顯著性的變化,可以看到很多矛盾地坡谷,也就是在特定區段,某些GO term是有顯著的,但經過這段時間又不顯著了

screenshot.png

最後這組圖,則是很有趣的來顯現注視版本造成分析一致性改變的顯示方法。

另外,此篇文章有講到一個案例

Berry et al. concluded that there is “an interferon-inducible
neutrophil-driven blood transcriptional signature in human tuberculosis,” where differentially expressed genes
were identified to be interferon-related. The authors proposed a set of these genes as diagnostic markers. However,
in subsequent years, it became clear that these genes, and interferon-stimulated genes in general, are not specific
or sensitive to tuberculosis. Therefore, changes in the Gene Ontology and its annotations might affect the interpretation
of experimental results。

Berry, M. P. R. et al. An interferon-inducible neutrophil-driven blood transcriptional signature in human tuberculosis. Nature 466,
973–977 (2010).

這案例頗有趣的,告訴我們在Nature刊登的文章,其結論也不是永遠正確的,所以要不斷地檢視新出現的證據。

基本Gene Ontology觀念文章:
1. 科學網李澤部落格 Gene Ontolgoy (一)/ (二)
2.豆瓣:什麼是Gene Ontology?

書籍閱讀:Envisioning Information

envisioning-information

這本Envisioning Information是Edward R. Tufte所撰寫的,相對於其前一本著作The Visual Display of Quantitative Information,提供的觀點是更加進階,針對於如何面對高維度的資料量。

這本書的大綱為
1. Escaping Flatland
2. Micro/Macrio Readings
3. Layering and Separation
4. Small Multiples
5. Color and Information
6. Narratives of Space and Time

如同Edard R. Tufte的風格,這本書不是個視覺化指引手冊,而是在探討觀念。

第一章 Escaping Flatland

escaping_flatland_one

上面這張日本古地圖,開啟這本書,巧妙地利用立體的畫法,結合標籤,和右邊扁平鐵路圖,清楚說明了這本書想要觀察的視覺化問題:複雜資料的視覺化。

從人類開始有望眼鏡觀察日蝕後,開始能記錄這件事情,作者用一系列圖表的變化,來展現複雜數據視覺化的觀念。從左上角,單純地描繪日蝕所在的位置,再到連續很多張圖代表時間,用拋物線代表日昇月落的時間軸來放置圖表,在下一張把所有日蝕放在同一個圈中,再來抽掉圓形,只看每個日蝕位點變化隨者時間的變化,形成著名的蝴蝶圖,最後進化成近代的圖表集大成。

(micro/macro=>small multiples=>layering and separation=>……)

醫病共享決策Shared Decision Making,SDM

臨床共享決策SDM是最近台灣衛福部大力推動的,其精神旨在推動以病人為中心的醫療照護,將病人及其家屬納為醫療團隊的一份子,協助病人考量到醫療外的需求,促進醫病、醫護之間的溝通,關鍵在使用互動性的工具作為協助。
螢幕快照 2018-03-28 上午9.59.45

 

臨床上醫護團隊與病人的互動大致都是循者一下的流程:疾病診斷、輔導面對病情,指引醫療決策、EBM呈現、建立個人/家庭需求、醫病團隊溝通、達成醫療決策,進行治療。而SDM便是奠基於這流程下,加強醫療團隊與病人共同互動的程度。

SDM的概念起源于1982年美國以病人為照護中心的福祉計畫,在1997年由Charles提出操作型定義,至少要有醫師和病人雙方共同參與,醫師提出各種不同處置之實證資料,病人則提出個人的喜好與價值觀,彼此交換資訊討論,共同達成最佳可行之治療選項。

而為了實踐醫病共享決策的目的,就必須建立在有更好的工具,以下是SDM工具所具有的特性:
1. 互動式
2. 圖形化說明
3. 結構化問題
4. 病人可自行使用
5. 總結病患問題
6. 自動更新EBM
7. 提供充足時間

當然不是所有的臨床場景都適合使用這類醫病共享決策,常見的臨床場景是具有重大醫療不確定性、尚無明確之實證醫療證據、高風險嚴重疾病、需長期服用的藥物、具有重大身心功能、形象改變或併發症的手術診斷與治療方式。

下面有一些不錯的國際案例,可以觀察他的介面設計以及如何改善問券乏味的方式:

 

加拿大Ottaw Hospital
螢幕快照 2018-03-28 上午10.05.04

英國NIH Magic Project

 

英國Option Grid

螢幕快照 2018-03-28 上午10.11.52

英國NICE
螢幕快照 2018-03-28 上午10.02.08

美國梅約診所Mayo Clinic
糖尿病

 

Medscape One-On-One系列:Eric Topol訪問矽谷頂級創投Khosla資本創始人Vinod Khosla

螢幕快照 2018-03-27 下午4.21.15

Vinod Khosla是知名企業昇陽電腦的創辦人,目前是頂級矽谷創投創始人Khosla Venture,想更深入了解他,可以看這其在史丹佛商學院的訪問影片。

這部訪談的重點是想要深入理解Khosla在其創投所提出的未來商業白皮書(寫得很棒的白皮書,描繪對於醫療未來的看法)中所描繪的:百分之八十的醫師將在未來被取代。

第一點,當前醫師花太少時間在病人身上,這在未來會有所改變

My view is that doctors should be involved in the most human elements of care. A very large percentage of what doctors do can be done with technology, which would free the doctor to do other things. No doctor spends enough time with the typical patient

第二點,在科技進步的當下,連汽車上面的感測器都比人類現在在醫療場域中被監測的還多太多,這絕對代表很大的改善空間。

One other fundamental thing is that medicine almost always has been based on symptoms. I feel something, I report that, then you doctors go on a detective chase and you mostly come up with the right answers. This pains me. There are, perhaps, a few hundred sensors in the typical car and none in the body. A single ad shown to you on Facebook has way more computing power applied to it than a $10,000 medical decision you have to make. It blows my mind.

第三點,各領域的破壞創新都不是來自於原本領域的佼佼者,醫療領域沒有理由是例外。(可能暗示者改變醫療可能並不是從醫院裡面開始),從第三世界醫療缺乏處或是其他角色。

No large change comes from an organization that is at the center of the system, for two reasons: First, they tend to think linearly; and second, they really don’t have an incentive to cause disruption because “disruption" sounds like a great word but it is painful for some people. If you have been disrupted, it is not fun.

Walmart didn’t change retail; Amazon did and it made it pretty damn uncomfortable for all other retailers. Boeing and Lockheed didn’t change space; SpaceX did. General Motors and Volkswagen didn’t change electric cars or self-driving cars; it was Waymo and Tesla. NBC and CBS didn’t change media; it was Twitter, Facebook, and YouTube. I am hard-pressed to find one large change that came from an institutional source in that area. If you do find one, tell me.

Why should healthcare be different?

第四點,未來的細節是無法預測的,但是方向是可以的

One of the things about large change is that it is very hard to predict. I was directionally right but really embarrassingly wrong on the specifics. I suspect that I will be the same with healthcare.

 

 

美國推動基因體學研究至大眾健康的重要組織:Office of Public Health Genomics, OPHG

美國在推進人類基因體學計畫時,就在思考這些基因研究如何應用到大眾健康上,於是在1997年成立美國國家大眾健康基因體辦公室(Office of Public Health Genomic, OPHG),為美國國家疾病管制局其下的分支,其負責人為Muin J. Khoury, MD, PhD

identifying, evaluating, and implementing evidence-based genomics practices to prevent and control the country’s leading chronic, infectious, environmental, and occupational diseases

以上為此機構成立的目的,利用基因體知識,發展具有證據的公共衛生實踐策略。從時間軸上,OPHG分階段地來努力發展一套嚴謹可用的方式來使用基因資訊提升大眾健康:
ACCE_wheel_sm
2000-2004年,OPHG先推動ACCE Project,為了先產生一套框架,來評估基因檢測項目,主要有三要點:Analytic validity, Clinical validity, Clinical Utility。由此提出44個問題來思考單一疾病在做基因檢測時候的效益。在這階段主要是針對單一疾病,來評估基因檢測對其臨床上的幫助。
2005-20014年,OPHG緊接者ACCE Project完成了粗步針對單一疾病的評估架構,因而開啟Evaluation of Genomic Applications in Practice and Prevention,EGAPP計畫,此計畫便是落實ACCE提出的模型,實際使用其模型來對於當時的基因體研究結果做評估。

在EGAPP發表的一篇總結性質的論文:The EGAPP initiative:lessons learned 裡面算是覆盤了8年多推動系統性評估基因技術在第一線醫學使用的心得,其中一個最重要的便是闡述基因體研究和臨床研究最大的差異,便是在於跟“臨床結果”串連的程度,大多數基因體研究通常都沒有做到這一步,造成系統性評估時,常常會提供不了臨床等級的證據,或是結論使用不到實際臨床場域中。(相信這隨者時間一定會改善的)

從這篇OPHG負責人Muin J Khoury 2017年發表在JAMA上面的文章:No Shortcuts on the Long Road to Evidence-Based Genomic Medicine. 可以看出要將基因資料應用在臨床醫學上是如此漫長之路。

下面是從Textbook of Family Medicine, 9th 第43章節錄出來的,可以看出EGAPP的建議大多為“負”建議的。

螢幕快照 2018-03-26 下午10.28.11

在2017年這篇From public health genomics to precision public health:a 20-year journey文章,裡面有更近一步提到CDC在2017年八月發表的簡易horizon-scanning methods:(主要為2014年這篇Prioritizing Genomic Applications for Action by Level of Evidence: A Horizon‐Scanning Method

Tier Evidence for recommendation Example
Tier 1 Supported by a base of synthesized evidence for implementation in practice HBOC, Lynch syndrome, newborn screen, FH
Tier 2 Synthesized evidence is insufficient to support routine implementation in practice; may provide information for informed decision making Many pharmacogenomics test
Tier 3 Evidence-based recommendation against use; or irrelevant synthesized evidence identified; not ready for routine implementation in practice Direct-to-consumer personal genetics test

看到這邊會小震撼一下,至少目前DTC產品在FDA的眼光中還不成熟於在臨床中日常使用,這邊可以連結到目前CDC Public Health Genomic資料庫中各Tier裡的資訊

閱讀參考:
The EGAPP initiative: lessons learned. (2014). Genetics in Medicine
From public health genomics to precision public health: a 20-year journey. (2017). Genetic in MedicineFrom public health genomics to precision public health: a 20-year journey. (2017). Genetic in Medicine

Human Genome Epidemiology, 2nd edition.

網站:
CDC Public Health Genomic
ACCE
EGAPP