Broad Institue博德研究中心CommKit期刊系列(四):How to go about writing paper introduction

簡介的部分它最重要的目的便是提供你的讀者一個背景知識,讓讀者能理解你這邊研究的內容。

Clarity is achieved by providing information in a predictable order.

螢幕快照 2018-04-04 下午2.21.22

General Background. Introduce the general area of science in which your project takes place, highlighting the status of our understanding of that system.

Specific Background. Narrow down to the sub-area that your paper will be addressing, and again highlight the extent of our understanding in this sub-area.

Tip: Give your readers the technical details they need to understand the system –nothing more. Your purpose is not to showcase the breadth of your knowledge but instead to give readers all the tools they need to understand your results and their significance.

Knowledge Gap. After discussing what we know, articulate what we do not know, specifically focusing on the question that has motivated your work. The prior two components should serve as a set-up for this question. That is, the question motivating your work should be a logical next step given what you’ve described in the general and specific background.

“Here we show…” Very briefly summarize your methods and findings. Note that you may end this section with a sentence or two on the implications/novelty of your results, although this is not essential given that you will more thoroughly address these points in the discussion section.

Broad Institue博德研究中心CommKit期刊系列(三):How to go about writing paper discussion

好的論文討論要件
1. 將研究的結果用一兩句話呈現
2. 將研究到底如何貢獻在開頭所提出的問題
3. 解釋這個研究跟其他相關研究的關聯
4. 解釋這個研究的限制和哪些問題沒有回答
5. 解釋這邊文章的結果能如何用來延伸這個大問題

螢幕快照 2018-04-04 下午2.14.18

目的
論文討論這塊是最能展現你對於你的研究結果如何能貢獻在這個大問題的看塊,另一方面,簡介和討論是一組的,在簡介的地方你必須說明你在解決什麼樣的問題,而討論的部分則是說那你如何貢獻這個問題。(sure, but so what?)

參考
http://mitcommlab.mit.edu/broad/commkit/journal-article-discussion/

Broad Institue博德研究中心CommKit期刊系列(二):How to go about writing paper results

好的研究結果之要件
1. 清楚註明資料和結論是從哪邊來的
2. 資料的呈現能符合邏輯順序
3. 論述的過程依據take-home message來搭建

目的:
1. 清楚地且客觀地描述你是如何取得研究結果或資料
2. 根據這些資料來提供所謂的take-home message

將臆測的部分放在討論的地方

技巧
1. 將結果有邏輯地整理成幾個區段
2. 每個結果區段都有rationale, data, and a transition(唯一臆測便是用來做這個用途的)
3. 只展現需要展現的資料
4. 注意風格

參考
Broad Institue CommKit: Journal Ariticle Result
http://mitcommlab.mit.edu/broad/commkit/journal-article-results/

Broad Institue博德研究中心CommKit期刊系列(一):How to go about writing a paper

如何開始撰寫一篇論文呢?
有人會從摘要開始,有人從結論開始,也有人從緒論開始,其實怎麼撰寫都可以。

假如你不知道該從何處開始,其實可以建議從結論開始撰寫。Anecdotal evidence顯示大多數人其實發現從結果(result)開始寫會比較簡單。當結果寫完後,就可以作為一個羅盤來指引整篇論文的撰寫。

要考慮的事情?
1. 摘要(Abstract):我要如何簡單明嘹地來說明我研究的重要性呢?
2. 介紹(Introduction):什麼資料是讀者需要的,以歷來對於我的研究有所了解呢?
3. 討論(Discussion):什麼新的insights或是問題是我可以帶給讀者的,當他知道這些結論呢?
4. 方法(Methods):什麼方法是我用來取得結論的?

什麼是你這篇論文主要想傳遞的訊息或是所做的結論呢?
1. 將所有資料,依據實驗分類
2. 將所有實驗結果簡單寫下重要的結論
3. 討論這些結論之間的關聯,然後如何將其整理成有邏輯的順序
4. 將結果整理成大綱,並且思考,這樣的順序如何影響介紹(Introduction),摘要的Punchline,在討論中要提出的問題?
5. 假如你沒有被說服,嘗試重新整理你的實驗順序,再跑一次這個流程

假如你依舊對於撰寫你的想法有困難:
你可以準備一份簡單的口頭報告,來跟朋友或是同事討論,這樣簡單的一個動作可以更容易釐清你的想法和研究的邏輯。
1. 跟熟悉你研究的同事討論,他們可以幫助你調整研究結果的順序是否合乎邏輯
2. 跟非熟悉你研究的朋友討論,他們可以幫助你清晰地描述你論文的重點

關於整理的小技巧
將資料整理成圖表
1. 紀錄實驗細節
2. 將實驗以時間序列整理
3. 將結果做成圖表

維持一個好的引用資料庫
1. 使用好的軟體
2. 維持所有方法的引用
3. 持續保持一份好的引用列表

持續尋找反饋,隨者你的資料有所更新
1. 給你的同事看你的圖表
2. 詢問是否有什麼進一步的實驗可以做

在寫作開始前
確認你要為什麼而寫,每個期刊都有寫作指引,可以依據此寫作指引製作“清單”

參考
General Tips: http://mitcommlab.mit.edu/broad/commkit/general-tips/

 

End-to-End 視覺化框架工具設計:vue2+koa2+d3.js(整理中)

正在著手開發一套複雜組學資料的視覺化分析系統,將其產生的圖,用在論文中,同時,可以順便做一套生資系統,畢竟目前在處理組學分析資料,好的視覺工具不多,也因此碰觸了d3.js。

本來只用koa2+d3.js來做靜態的設計,但後來發現代碼越來越巨大,要產生的各種視覺模塊可能會更多,為了更好的解決這問題,也必須用相對應的框架和工具(雖然選擇的標準是要越簡單越好。)後來決定試試使用vue2為前端的框架。

雖然還不確定行不行得通,先收集相關的資訊來試試。

相關資料

– 整合koa+vue
全栈开发实战:用Vue2+Koa1开发完整的前后端项目(更新Koa2)

– 整合d3.js和vue2
Composing D3 Visualizations With Vue.js

整合範例Chrisv Fritz 方條圖

Vue.js で d3.jsを使う その2(svgのcircleの半径を動的に変更する)

  • vue相關的工具
    webpack
    vue-cli

書籍閱讀:Visualization Analysis & Design

visualizationAnaalysisandDesign這本書Visualization Analysis & Design是由UBC資工系教授Tamara Munzner所撰寫的,是目前視覺化領域做為教科書很好的教材,內容可以說是極盡用心,每章節最後都會附有延伸閱讀可以進一步擴展。

這本書的出現,本身就是Tamara Munzner為了解決視覺化這新興領域沒有良好架構的問題而撰寫的,其擷取許多前人的大作,從Tufte開始,作者最喜歡的是他那本Envisioning Information,但唯一的缺點是Tufte的書通常都停留在非常傳統的視覺化技術,而最近20年來,視覺化技術最重要的是想要知道如何在互動性下能讓人探索到資料中更多的未知性質。作者推薦可以搭配此書的有:

Colie Ware.(2008).Visual Thinking for Design

假如想要更深入的或是偏技術面則可以考慮下面這兩本:

Wilkinson, Leland.(2005).Grammar of Graphics

Matthew O. Ward, Georges Grinstein, Daniel Keim.(2015).Interactive Data Visualization:Foundations, Techniques, and Applications

本書總共有15章:

第一章:介紹一套分析架構來做視覺化設計,藉由提問What-Why-How和相對應的Data-Task-Idiom
第二章:介紹What,也就是資料的類型和特性
第三章(精華):分別介紹Why和How,這邊算是整本最重要的地方,把整個思考架構的大圖講解出來。
第四章:延伸這個分析架構,多加上domain situation level和algorithm
第五章:多介紹一些關於視覺編碼的原則
第六章:提供八個設計法則
第七章:介紹表格類視覺化
第八章:介紹空間資料視覺化
第九章:介紹網絡資料視覺化
第十章:介紹顏色在視覺編碼中的原則
第十一章:討論如何處理關於視覺化中“視角”的問題
第十二章:如何處理視覺化中多重視角的設計
第十三章:如何簡化資料呈現量
第十四章:如何填加附屬的資料
第十五章:用六個例子收尾

假如想快速搭建自己設計視覺化的架構,可以閱讀第一張和第三張,第二章有點惱人。
這邊分享第三章的內容:

visualization_action_whyvisualization_how

健康管理- 將疾病扼殺在搖籃裡:反人性的做法

“扼殺在搖籃裡”這詞彙蠻有意思的,不知道是否是個厘語還是某個時期的流行用語!剛好閱讀完王煜全第178講 健康管理-將疾病扼殺在搖籃裡,跟最近看到由德巴克·喬普拉(Deepak Chopra, MD)的書:超級基因(Super Genes)自癒(Healing Self),和關注的新興醫療領域(整合醫療、生活習慣療法..)等串連再一起。

在王煜全全球科技250講中第178講中的這段話

不論是學術界、政府、社會,甚至個人都知道健康管理的重要性,但是健康管理作為一個產業,尤其是比起以治療為主的專科醫療、急重症醫療,在國內發展得並不快,產業規模也不大。

那這是為什麼呢?

其實是因為,洞察和順應人性的商業一班都會成為剛需,市場巨大,但是健康管理其實有點兒反人性的,是要和人性做鬥爭的產業。

所以醫院的治病救人是順應人性的,他是剛需,所以他也會收到比較高的經濟回報,而健康管理目前的市場還比較小

上面王煜全的觀察結論很一針見血,醫學裡面談的通常都是致病後的治療,在惡性循環中,稍微矯正回正常狀態,放病人回家以後,病人依舊是照原本生活方式去過,想說只靠藥物來幫助,但事實上,生活上的調整是相當重要的,而健康的生活就是反人性,必須依靠紀律和意志力來維持的,畢竟大自然的規律就是讓亂度最大化。

也許所謂的健康管理是一個方向,代表隨者教育和經濟的進步,人們對於自我健康注重會增加,而有下面三大趨勢:

一是健美的身材、健康的飲食以及積極向上的精神狀態已經成為一種社會風尚,甚至可以代表社會地位。

二是越來越多的人喜歡通過社交媒體曬自己堅持運動、健康飲食的生活方式。

三是正念、冥想、瑜伽也成了新時尚。

如何提供工具給予願意或是想要維持健康的人能自我健康管理,相信會是未來很重要的商業領域。

 

文獻閱讀:Interpretation of biological experiments changes with evolution of the Gene Ontology and its annotation

Aurelie Tomczak, .ed .(2018).Interpretation of biological experiments changes with evolution of the Gene Ontology and its annotations. Scientific Reportsvolume 8, Article number: 5115

這篇文章談論的重點是使用基因功能資料(基因本體/Gene Ontolgoy)來分析基因群,可能因註釋版本不同會造成分析結果的變化

論點不新奇,但是論文的分析過程所使用的觀念可以學起來,作為一種基因富集分析的“品質確認”,用來知道自己的實驗結果,在此分析下找到顯著的基因功能,是否有偏差。(這部分的觀念應該還沒有,該如何做生資分析的quality control?)

從此篇論文可以學習的觀念有:
1. 如何做一致性分析(consistency calculation),使用Jaccard Index。
2. 利用資訊熵分數(Information Content score)來評估一個基因本體的字元(term)其使用頻率和資訊有鑑別度的比率。

此篇論文中所包含的實用知識有:
1. 目前Gene Ontology裡面註釋字彙(annotation term)的消長
2. 在Gene Onotology中有被註釋到和沒被註釋到的基因比例變化

這篇論文使用MetaSignature的104個基因集作為分析的基礎來探討這些基因集拿來做基因富集分析,在不同版本的Gene Ontology下所造成的結果差異。

screenshot.png

此篇論文起手式來分析其不同版本GO註釋資料的差異,從2004到2015年,單一基因被註釋的比例,完全沒有被註釋到的基因數百分比從66.6%到35%,另外,被研究比較多的基因,的確其增加的GO term注釋是提供更多更精準之資訊。

screenshot.png

這張圖則是顯示了不同所謂顯著的GO term隨者不同版本,其顯著性的變化,可以看到很多矛盾地坡谷,也就是在特定區段,某些GO term是有顯著的,但經過這段時間又不顯著了

screenshot.png

最後這組圖,則是很有趣的來顯現注視版本造成分析一致性改變的顯示方法。

另外,此篇文章有講到一個案例

Berry et al. concluded that there is “an interferon-inducible
neutrophil-driven blood transcriptional signature in human tuberculosis,” where differentially expressed genes
were identified to be interferon-related. The authors proposed a set of these genes as diagnostic markers. However,
in subsequent years, it became clear that these genes, and interferon-stimulated genes in general, are not specific
or sensitive to tuberculosis. Therefore, changes in the Gene Ontology and its annotations might affect the interpretation
of experimental results。

Berry, M. P. R. et al. An interferon-inducible neutrophil-driven blood transcriptional signature in human tuberculosis. Nature 466,
973–977 (2010).

這案例頗有趣的,告訴我們在Nature刊登的文章,其結論也不是永遠正確的,所以要不斷地檢視新出現的證據。

基本Gene Ontology觀念文章:
1. 科學網李澤部落格 Gene Ontolgoy (一)/ (二)
2.豆瓣:什麼是Gene Ontology?

書籍閱讀:Envisioning Information

envisioning-information

這本Envisioning Information是Edward R. Tufte所撰寫的,相對於其前一本著作The Visual Display of Quantitative Information,提供的觀點是更加進階,針對於如何面對高維度的資料量。

這本書的大綱為
1. Escaping Flatland
2. Micro/Macrio Readings
3. Layering and Separation
4. Small Multiples
5. Color and Information
6. Narratives of Space and Time

如同Edard R. Tufte的風格,這本書不是個視覺化指引手冊,而是在探討觀念。

第一章 Escaping Flatland

escaping_flatland_one

上面這張日本古地圖,開啟這本書,巧妙地利用立體的畫法,結合標籤,和右邊扁平鐵路圖,清楚說明了這本書想要觀察的視覺化問題:複雜資料的視覺化。

從人類開始有望眼鏡觀察日蝕後,開始能記錄這件事情,作者用一系列圖表的變化,來展現複雜數據視覺化的觀念。從左上角,單純地描繪日蝕所在的位置,再到連續很多張圖代表時間,用拋物線代表日昇月落的時間軸來放置圖表,在下一張把所有日蝕放在同一個圈中,再來抽掉圓形,只看每個日蝕位點變化隨者時間的變化,形成著名的蝴蝶圖,最後進化成近代的圖表集大成。

(micro/macro=>small multiples=>layering and separation=>……)