再訪Bioawk:定序序列分析

處理Fastq和Fasta檔案是進入次世代定序後常會遇到的情境,且當你有特殊需求時,可能就必須要從底層開始來設計你的序列分析方法。

之前寫過 Bioawk:專門處理定序相關格式的awk(fasta,fastq,bed,sam,vcf,gff)awk 進階筆記:字串處理, awk裡好用的變數:FS, OFS, RS, ORS, NR, NF, FILENAME, FNR。 最近開始又要處理序列,所以來稍微複習一下。

推薦觀看美國猶他大學(University of Utah)的教授Aaron R. Quinlan的應用基因體學課程中分享AWK和Bioawk的影片:Applied Computational Genomics – awk and bioawk,裡面的講解簡單且易上手。

AWK是一個古老的Unix程式,在1970年代在當時資通訊最前沿的貝爾實驗室,由三位工程師Alfred Aho, Peter Weinberger, Brian Kernighan共同開發的,主要是一款字串處理程式。

AWK reads the input a line at a time. A line is scanned for each pattern in the program, and for each pattern that matches, the associated action is executed.

— Alfred V. Aho

使用bioawk和seqkit基本上,就可以解決百分之90以上,在fasta/fastq的前處理和基本分析需求,另外,fastp也是另一個蠻不錯的軟體,蠻適合用來修剪(trim)序列使用,速度也快。

bioawk基本上是建立在awk的語法上,但提供不錯原生的變數可使用,基本涵蓋次世代定序相關的資料結構,所以非常方便,減少許多重新發明輪子的問題,如下表:

BEDSAMVCFGFFFASTX(FASTA/FASTQ)
chromqnamechromseqnamename
startflaqpossourceseq
endrnameidfeaturequal
nameposrefstartcomment
scoremapqaltend 
strandcigarqualscore 
thickstartrnextfilterfilter 
thickendpnextinfostrand 
rgbtlen group 
blockcountseq attribute 
blocksizesqual   
blockstarts    

使用情境

計算序列檔案中有幾個reads?

bioawk -c fastx '{print $name}' input.fasta | wc -l

計算序列檔案中,每一個reads有多長,並且輸出成一個tab相隔的資料

bioawk -c fastx '{prin $name, length($seq)}' input.fasta > reads_length.txt

篩選序列檔案中,長度大於3000,小於4000的reads

bioawk -c fastx 'length($seq)>3000 && length($seq)<4000{print ">"$name;print $seq}' input.fasta > filtered_input.fasta

進階情境

篩選序列檔案中,含有在序列ID檔案中的reads

seqkit grep -f curated_id.txt input.fastq -o curated_input.fastq

篩選序列檔案中,用特定引子對去做對照,其可以夾出來的核酸區域

seqkit amplicon -F ATACTTCCTATCGCGTA -R TCTATCGCTCGATC input.fasta

閱讀參考:

生信小工具:awk的升级版bioawk

bioawk github

fastp gitbhub

seqkit 使用说明

2016. SeqKit: A Cross-Platform and Ultrafast Toolkit for FASTA/Q File Manipulation. PLos One

Shifu Chen, Yanqing Zhou, Yaru Chen, Jia Gu; fastp: an ultra-fast all-in-one FASTQ preprocessor, Bioinformatics, Volume 34, Issue 17, 1 September 2018, Pages i884–i890, https://doi.org/10.1093/bioinformatics/bty560

Bioawk basic

分子醫學於臨床醫師之教育

大概對於基因的興趣,緣起頗早,但因為這十年基因科技的進步速度過快,很難在傳統的醫學教育中能習得,即使到了住院醫師階段在臨床病理訓練之中,這類技能還是無法由機構教育或是傳統師承中獲得,這或許是一個蠻需要提升的點。

這是在去年年底於科內分享之主題,對於如何分享這類知識和興奮,其實是我蠻感興趣的,畢竟建置一個好的前沿分子檢測實驗室,需要一整組人,所以與其把自己打造成全方位,可能需要花一點時間建置內部教育系統,相對來說比較能放大。

在準備這類資訊時,也發現這不單只是目前國內醫學或是病理教育的問題,其實在國外也是,關鍵在於領域進步太快,又太能快速給予病人照顧回饋。不過從另一方面來說,各行各業都面臨如何導入新資訊技術的挑戰,所以醫療行業也不免俗的會遭遇。

這篇是在探討美國病理醫師教育裡面,去探討生物資訊學於其中遇到的困難,這邊羅列的狀況跟這裡很像,不外乎為:

  • 在醫學院教育中就沒有相關資源暴露(這樣寫是因為不一定是要寫在課程內,也可以用其他模式讓同學能有意願暴露於其中)
  • 相關師資缺乏這領域的概念和知識
  • 原本的病理訓練過程中,要學習的事物就太多了
  • 臨床服務過重
  • 醫師並不認為這很重要,相對就不會去學習
  • 缺乏相關的教育資源

其實仔細一看,這跟我們這邊所面臨的狀況完全一致,所以這應該是全球性的困難議題。

這邊則是另一份研究報告,雖然比較久遠,但顯示的是更細去看,相關病理專業醫師對這類技術理解的深度調查。

The Current State of Resident Training in Genomic Pathology: A Comprehensive Analysis Using the Resident In-Service Examination, American Journal of Clinical Pathology, Volume 142, Issue 4, October 2014, Pages 445–451, https://doi.org/10.1309/AJCPH2A4XTXJUKDZ

這邊很明顯的是可以讓人知道,普遍住院醫師在病理科訓練後,對於基本分生領域的知識如聚合酶連鎖反應(Polymerase chain reaction)、核酸定序(DNA sequencing)、單核甘酸多型性變異(Single Nucleotide Polymorphism)、次世代定序(Next-generation sequencing)其實普遍沒有太多的掌握。

在2020年,在美國臨床病理協會裡面有一個所謂的Training Residents in Genomics Working Group,發表了新的一篇探討住院醫師訓練的文章:Integration of Genomic Medicine in Pathology Resident Training,可以清楚看到教育人員對於目標有更佳清楚了認定。

from Figure 4. Haspel RL, Genzen JR, Wagner J, Lockwood CM, Fong K; Training Residents in Genomics (TRIG) Working Group. Integration of Genomic Medicine in Pathology Resident Training. Am J Clin Pathol. 2020;154(6):784-791. doi:10.1093/ajcp/aqaa094

可以看到在2020年時,問券的問題更加具體化,把技能定位更為清楚,分為:

  • 能直接討論次世代定序報告 Discuss NGS-Based Report
  • 能直接討論桑格定序或是聚合酶連鎖的檢驗報告 Discuss Sanger/PCR-Based Report
  • 判斷否個基因變異的臨床意義 Determine Significance of Genetic Variant
  • 選擇適合的分生檢驗方法 Selecting the Best BLock for Genetic Testing
  • 討論切片報告 Discuss Colon-Biopsy Report

對資料庫的掌握程度

from Figure 5, Haspel RL, Genzen JR, Wagner J, Lockwood CM, Fong K; Training Residents in Genomics (TRIG) Working Group. Integration of Genomic Medicine in Pathology Resident Training. Am J Clin Pathol. 2020;154(6):784-791. doi:10.1093/ajcp/aqaa094

可以看到這幾個基因和臨床藥物使用相關的重要資料庫或工具,如PharmGKB, PolyPhen, cBioPortal, ClinGen, ClinVar, ClinicalTrials.gov, COSMIC, OMIM, PubMed,所以代表這算是臨床病理住院醫師需要去碰觸與理解的區塊。

在2021年七月,美國分子病理學會發表了一份更細緻的訓練活動論文:A curriculum for Genomic Education of Molecular Genetic Pathology Fellows. The Journal of Molecular Diagnostics,裡面有更細且更全面地去剖析分子病理裡面的知識點:

  • Test Selection and Design
  • Specimen Acquisition and Assay Input
  • Testing
  • Bioinformatics
  • Clinical Interpretation
  • Validation and laboratory management

台灣臨床病理暨檢驗學會是負責台灣臨床病理專科醫師訓練的學會,近期也更新了住院醫師訓練的計畫,導入所謂的里程碑評核表,架構上,相對比較貼近這邊的架構,細節如下:

  • 檢驗之設計與確效
    • 等級一:了解檢驗之設計與確效的各項步驟,包含分析方法確效與臨床確效
    • 等級二:在充分臨床病理專科醫師的指導下,能設計與確效一檢驗項目,包含統計分析層面
    • 等級三:在少許臨床病理專科醫師的指導下,能設計與確效一檢驗項目,包含統計分析層面
    • 等級四:能獨立地設計與確效一檢驗項目,包含統計分析層面
    • 等級五:能得到檢驗設計與確效之國家等級認證,例如:可獨立發表著作或報告
  • 品質確認
    • 等級一:了解品質確認的重要性
    • 等級二:在充分臨床病理專科醫師的指導下,進行一檢驗項目之品質確認,以確保分子基因檢驗結果之完整正確可性度
    • 等級三:在少許臨床病理專科醫師的指導下,進行一檢驗項目之品質確認,以確保分子基因檢驗結果之完整正確可性度
    • 等級四:能獨立地進行一檢驗項目之品質確認,以確保分子基因檢驗結果之完整正確可性度
    • 等級五:參與國家等級之檢驗項目品質確認計畫和準則之建立與執行
  • 檢驗結果的判讀
    • 等級一:基本了解分子基因檢測之判讀方法:
      • 體細胞變異、生殖細胞變異、微生物之偵測與定量、單株性評估
    • 等級二:在充分臨床病理專科醫師的指導下,進行體細胞變異、生殖細胞變異、微生物之偵測與定量、單株性評估
    • 等級三:在少許臨床病理專科醫師的指導下,進行體細胞變異、生殖細胞變異、微生物之偵測與定量、單株性評估
    • 等級四:能獨立地進行體細胞變異、生殖細胞變異、微生物之偵測與定量、單株性評估
    • 等級五:能夠制定基因體檢驗之臨床準則或是政策
  • 分子檢驗
    • 等級一:能了解血液病理、遺傳性疾病、人類白血球抗原、傳染病、固態腫瘤、藥物基因體學。
    • 等級二:在充分臨床病理專科醫師的指導下,指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級三:在少許臨床病理專科醫師的指導下,指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級四:能獨立地指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級五:能夠制定基因體檢驗之臨床準則或是政策
  • 基因體檢驗
    • 等級一:能解釋基因檢驗與基因體檢驗之差異,了解基因體檢驗之原理和方法學如微陣列、全基因組關聯分析、次世代定序。
    • 等級二:在充分臨床病理專科醫師的指導下,指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級三:在少許臨床病理專科醫師的指導下,指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級四:能獨立地指出基因體檢驗之適當臨床使用情況與判讀適切應用
    • 等級五:能夠制定基因體檢驗之臨床準則或是政策
  • 以病患為中心之檢驗報告判讀
    • 等級一:了解病患資訊對於解釋分子檢疫結果的重要性。
    • 等級二:在充分臨床病理專科醫師的指導下,尋找並整合其他病患資訊以正確判讀分子檢驗結果
    • 等級三:在少許臨床病理專科醫師的指導下,尋找並整合其他病患資訊以正確判讀分子檢驗結果
    • 等級四:能獨立地整合其他病患資訊,以正確判讀分子檢驗結果
    • 等級五:能夠制定如何整合其他病患資訊以正確判讀分子檢驗結果之臨床準則或是流程
  • 分子醫學實驗室的相關規範
    • 等級一:了解分子醫學實驗室的相關規範,能力試驗的目的與應用,了解品質保證的基礎知識,注重病人隱私和資料的保密,並符合醫院和政府的規範。
    • 等級二:在充分臨床病理專科醫師的指導下,可以落實分子醫學實驗室的相關規範,審閱能力試驗的結果。
    • 等級三:在少許臨床病理專科醫師的指導下,可以落實醫學實驗室的相關規範,並能夠依據能力試驗的結果進行相關的改正措施。
    • 等級四:參與醫學實驗室的稽核活動
    • 等級五:能夠進行分子醫學實驗室相關的稽核活動
  • 分子醫學實驗室管理
    • 等級一:了解分子醫學實驗室的組織架構,以及臨床病理專科醫師於實驗室人員管理的角色。
    • 等級二:了解分子醫學實驗室的人員組成以及工作流程。
    • 等級三:能夠說明分子醫學實驗室的人員管理作法,以及聘任流程。
    • 等級四:實際參與分子醫學實驗室人員的聘任過程
    • 等級五:能夠有效的管理分子醫學實驗室人員。
  • 實證醫學下的檢驗應用
    • 等級一:了解依據實證醫學來應用分子醫學檢驗的重要性
    • 等級二:在充分臨床病理專科醫師的指導下,能夠進行嚴謹的文獻回顧,依據實證醫學,說明分子醫學檢驗的應用。
    • 等級三:在手許臨床病理專科醫師的指導下,能夠進行嚴謹的文獻回顧,依據實證醫學,說明分子醫學檢驗的應用。
    • 等級四:能夠獨立地進行嚴謹的文獻回顧,依據實證醫學,說明分子醫學檢驗的應用,並且發展相關的準則。
    • 等級五:能夠實驗機構中之分子檢驗的臨床應用準則,並對實證醫學有所貢獻。

整體可以看到對於分子醫學這塊,歐美與台灣的臨床學會都正努力地改善現有的訓練制度,但實際上要讓學員能獲得這些確認點之學習,還是得有動手實作的活動,下面這些資訊就可以用來幫忙設計:

from 2019, Integrating Molecular Biology and Bioinformatics Education
from 2019, Integrating Molecular Biology and Bioinformatics Education

閱讀參考:

  • Bandura, A. (1977). Social learning theory Englewood Cliffs: NJ: Prentice-Hall.
  • Cruess, S. R., Cruess, R. L., & Steinert, Y. (2008). Teaching Rounds: Role modelling—making the most of a powerful teaching strategy. BMJ: British Medical Journal, 336(7646), 718.
  • Snell, L. (2011). The resident-as-teacher: it’s more than just about student learning. Journal of graduate medical education, 3(3), 440-441.
  •  Sternszus, R., & Cruess, S. R. (2016). Learning from role modelling: making the implicit explicit. The Lancet, 387(10025), 1257-1258.
  • Wright, S., Wong, A., & Newill, C. (1997). The impact of role models on medical students. Journal of General Internal Medicine, 12(1), 53-56.
  • 住院醫師担任臨床教師培訓計畫之回顧與趨勢.2015. https://www.vghtc.gov.tw/UploadFiles/WebFiles/WebPagesFiles/Files/e19681d9-cb4c-42b9-afab-5e72f0409d4b/17.pdf
  • Rosenbaum JN, Berry AB, Church AJ, Crooks K, Gagan JR, López-Terrada D, Pfeifer JD, Rennert H, Schrijver I, Snow AN, Wu D, Ewalt MD. A Curriculum for Genomic Education of Molecular Genetic Pathology Fellows: A Report of the Association for Molecular Pathology Training and Education Committee. J Mol Diagn. 2021 Oct;23(10):1218-1240. doi: 10.1016/j.jmoldx.2021.07.001. Epub 2021 Jul 7. PMID: 34245921
  • (2021). Productive visualization of high-throughput sequencing data using the SeqCode open portable platform. Sci Rep
  • (2021). Community development, implementation, and assessment of a NIBLSE bioinformatics sequence similarity learning resource. PLoS Once
  • (2017). Bioinformatics Education in Pathology Training: Current Scope and Future Direction. Cancer Informatics
  • (2021). Pathology Residency Program Special Expertise Tracks Meet the Needs of an Evolving Field. Acd Pathology
  • (2013). Best practices in bioinformatics training for life scientist.  https://academic.oup.com/bib/article/14/5/528/219086
  • (2014).  The Current State of Resident Training in Genomic Pathology: A Comprehensive Analysis Using the Resident In-Service Examination, American Journal of Clinical Pathology
  • (2020). Integration of Genomic Medicine in Pathology Resident Training: A Work in Progress, American Journal of Clinical Pathology, Volume 154, Issue 6, December 2020, Pages 784–791, https://doi.org/10.1093/ajcp/aqaa094
  • (2019). Regulation of Laboratory-Developed Tests A Clinical Laboratory Perspective
  • (2017). Bioinformatics Education in Pathology Training: Current Scope and Future Direction
  • (2019). Fostering bioinformatics education through skill development of professors: Big Genomic Data Skills Training for Professors
  • (2019), The Effect of Laboratory Test-Based Clinical Decision Support Tools on Medication Errors and Adverse Drug Events: A Laboratory Medicine Best Practices Systematic Review. 
  • (2019). Integrating Molecular Biology and Bioinformatics Education. Journal of Integrative Bioinformatics
  • (2021).Ten simple rules for organizing a bioinformatics training course in low- and middle-income countries. PLoS One
  • https://github.com/alan-turing-institute/data-training-for-bioscience
  • https://www.open-bio.org/events/bosc-2021/
  • https://lifescitrainers.org/trainers-registry/
  • (2021). Fostering accessible online education using Galaxy as an e-learning platform. PLoS One

科學月刊-生物資訊大解碼

四月份科學月刊生物資訊大解碼相當吸引我,特定去訂了紙本雜誌來蒐藏,看裡面會怎麼去分享這個非常重要且多元的領域,雖然所謂的生物資訊領域已經至少十年以上,但其內涵和產業大概每五年都會有蠻多不同的技術系統出現。

這集封面故事主要有四篇文章組成:

四篇文章都是用淺顯易懂的方式來分享這領域的看法和知識。

第一篇生物資訊是什麼,是由林志鵬所撰寫,他是英華達醫療電子事業部資深經歷,銘傳大學兼任助理教授,曾任有勁基因研究服務銷售總監。

  • 1989,美國人類基因體計畫(Human Genome Project)的開始,2007年次世代定序地出現,從10年30億美元定序一組簡略且錯誤百出的參考基因組,到2天內解碼48個人類的基因。
  • 最原始的生物資訊,探討生物核酸序列的異同: 美國國家生物技術資訊中心的BLAST
  • 從核酸序列的分析到蛋白質結構的預測:蛋白質資料庫(Protein Data Bank, PDB),從1994年還有蛋白質結構預測的關鍵評估(Critical Assessment of protein Structure Prediction, CASP)比賽,近年來的機器學習也開始被應用於這類巨量資料之中。
  • 2015年美國總統歐巴馬提出的精準醫學計畫(Precision Medicine Initiative),預計搜集100萬人的基因資料用於疾病診查使用。
  • 2020年的自然期刊上,刊登英國10萬人的全基因組定序計畫(UK100K),顯示出英國政府在這領域的決心。

第二篇生物醫學資訊科技帶領醫療數位轉型,是由張明台所撰寫,其為亞大基因科技創辦人,此篇撰寫就可以看出偏重資訊架構面在建置基因定序服務於實驗室會需要考慮和面對的狀況。

這篇文章

from 2021. Precision medicine in 2030—seven ways to transform healthcare

  • 資訊科技應用在生物資料上有很重要的角色,如何選擇演算法工具、統計方法,資料儲存和管理的方式,是否建置資料湖泊(data lake),怎麼處理排成、運算資源最佳化、數據安全性、流程是否符合法規。
  • 建置臨床基因檢測實驗室包含了生物資訊分析設計、IT軟硬體系統建置,以及維運的中央實驗室,本質上技術含量極高,且跟傳統的醫療專業相當不同
  • 全球基因體學和健康聯盟(Global Alliance for Genomics and Health, GA4GH)的研究,在2025年,在臨床醫療場域將會有超過4750萬罕見疾病基因體,以及8300萬癌症基因體被定序,到2027年將有70%的癌症診斷檢測,使用基因定序分析。
  • 如何將半導體產業的自動化電子設計(Electronic design automation)觀念,導入臨床生物資訊的流程設計,且能有功能驗證與確校,如何做好自動化流程設計。
  • 使用基因定序資料來計算同源重組修復缺失(Homologous recombination deficiency, HRD),包含使用單核甘酸變異(Singel nucleotide variants)、小片段插入缺失變異(Short insertion and deletion)、複製數變異(Copy number variation)、大片段基因重組(Large genomic rearrangement)
  • 分享美國國家衛生研究院柯林斯2021年在Cell雜誌分享對於2030年精準醫療的看法(Precision medicine in 2030 – seven ways to transform healthcare)
    • 巨量的縱貫長期的世代研究資料
    • 群體的生物多樣性
    • 大數據與人工智慧
    • 例行性臨床基因定序檢測
    • 電子健康紀錄
    • 表現型體學與環境因子
    • 隱私、信任與價值回顧

第三篇 以『次世代定序』完成精準醫療,更能協助生命科學領域的探索 由中央大學生醫科學與工程學系系統生物與生物資訊博士候選人 趙盈婷和中央大學生醫科學與工程學系副教授 許藝瓊撰寫,此篇就聚焦在次世代定序的介紹和與過去定序技術的比較和微生物箘群

  • 基本上,要先有資料,才有辦法有所謂的“資訊”,所以生物進入大數據時代,高通量定序技術絕對扮演重要角色,從第一代的定序技術桑格定序於1977年發行,到約2005-2007年開始有次世代定序技術,整個領域進步飛快
  • 次世代定序中,illumiina公司的技術算是主流,其只要是使用所謂的sequeing by synthesis的概念來打大規模定序。
from https://www.genscript.com/advancing-genomics-medicine-and-health-together-by-semiconductor-dna-synthesis-technology-summary.html

  • 次世代定序也開始被應用在不只人類疾病研究上,傳統微生物學研究,必須仰賴培養和後續的生化分類,或是簡單使用16s定序,如今使用次世代定序則依次可以探索檢體內所有的微生物核酸序列,美國腸道協會(American Gut Consortium)在2012年推出美國人腸道計畫(American Gut Project),其在2018年發表了第一個全面性的人類微生物體學資料庫,影響大眾開始對人體微生物群的興趣。
  • 同時,也可以利用此技術來研究環境中的微生物群體,免去培養等培養難題

第四篇學習生物資訊學要具備哪些能力,是李御賢教授的專訪,由科學月刊總編輯林翰佐採訪撰稿

  • 李御賢老師是國內很早期開始做生物資訊方向研究的學者從基因維陣列到後面的次世代定序資料,參與過SARS-COV病毒序列研究、史帝文森症候群的印務基因體學研究等等
  • 現在的生物資訊學家需要具備建立程式管鍊(pipeline)的能力,串連很多程式進行分析,且具備撰寫批次檔案的技能。
  • 建議對於生物資訊學有興趣的人可以從三項能力來培養
    • 基本建立分析管線能力Pipeline
    • 資料視覺化之技能
    • 基本生物學的基本素養
  • 生物資訊領域進步迅速,需要不段的累積新的知識和能力

使用區跨鏈打造去中心化科研DeSci

科學美麗的地方是來自於自由的分享和討論,心智間毫無保留的交流相信是很多做科學探索的人很喜愛的時刻,雖然那是幾乎不存在的,在當今科學研究越來越“內捲”,如何跳出現有的紅海,但持續做有趣的探索,於是開始有一個打破傳統學術劃分的組織出現,這些幾乎都是在2022年初幾個月內出現的,非常驚人!

from @UltraRareBio

區塊鏈本身是一個非常大的技術區塊,如今加密貨幣其實只是其中一塊市場較熟悉的部分,但實際上,可以想像是建立web3.0的基礎設施,可以參考之前寫的這篇文章:社群、區塊鏈、NFT和新型態生技開源模式,其中一個部分族群希望用區塊鏈來促進科學的自由化,所謂的去中心化科研,或是改善現有的科技、科學流通而努力的項目,上面那張圖則是目前紀錄跟這想法相關的(雖然他們用的英文都是去中心化,但我自己是覺得只能說新型態或是使用區塊鏈技術革新會比較適合,很多跟人類文明相關的東西,很難真的去中心化):

  • Science DAOs 基於區塊鏈架構之科學自治組織
    • VitaDAO
    • LabDAO
    • BioDAO
    • GenomesDAO
    • OpScientia
    • Research DAO
    • Research Hub DAO
    • PsyDAO
    • CRISPRDAO
  • Decentralized Funding of Science 新型態科學資助系統
    • Experiment.com
    • Vibe Bio
    • Crowd Funded Cures
    • SCINET
    • Sciencefund.io
    • DeSci Foundation
  • Decentralized Biotech 基於區塊鏈架構之生技社群
    • Perlara PBC
    • ValleyDAO
    • Phage Directory
    • Cloud Labs: STRATEOS, EMERALD
    • Molecule
    • OpenNMN
  • Scientific Publishing 新型態科學發表系統
    • Ants Review
    • Atoms.org
    • OpenAcessDAO
    • Flashpub
    • Braid Science
    • Seeds of Science
  • Foundations & Institutes 新型態科學機構
    • Foresight Institute
    • Astera Institute
    • DeSci Foundation
    • Arc Institute
  • Science x Art x Web3 科學藝術項目
    • UltraRare Bio
    • GENEnft
    • DNAVERSE
    • Atomic Heart NFT
    • SameYou
  • Communities & Chats 科學社群運營
    • Blockcahin for Science
    • Friendzymes
    • DeSci World
    • Bio Dojo

上面這些社群或是組織、項目都是這一年內出現的,主要都利用以太坊作為其基礎設施,大家都在探索這些機制要怎麼運用,蠻期待這方面的進展,這是一個補足開源科學的重要閉環,讓其具有原生性之金融系統,且超越國界及傳統的金融隔閡!

參考閱讀

DeSci@EthDenver

https://t.co/ziuXxjqc1a

艾西莫夫Issac Asimov的預言:綠藻吧

趁連假空出一段時間,來閱讀和思考,翻到很喜歡的作家鄭志凱在2016年的書:小國大想像,這本書大部分寫作時間是在2014年,距今也過了快十年,時空是在中美還沒有交惡前,疫情沒有爆發,其中一篇文章現在閱讀起來特別有感覺,上一次看這本書,我對於合成生物學的背景理解還不多,現在重看就異常有趣,其中一篇名為:1964, 2014, 2064的文章,原本發表於天下雜誌專欄,但在書裡面有再改寫,多加入一些東西,看到下面這段文章,讓我很有感覺:

from 小國大想像:第二章 1964, 2014, 2064

這幾句是來自艾西莫夫(Issac Asimov)的預測,艾西莫夫是科幻小說界的老鼻祖,從機器人系列、銀河帝國三部曲、基地系列,裡面塑造的未來,至今回看許多都成為真實,其中艾西莫夫對於未來有許多的預測,這邊有艾西莫夫的訪談,可以一睹前輩風采

The 2014 fair will feature an Algae Bar at which “mock-turkey" and “pseudosteak" will be served. It won’t be bad at all (if you can dig up those premium prices), but there will be considerable psychological resistance to such an innovation.

from Issac Asimov prediction

想起這一兩年實驗室養肉的新創如雨後春筍,看起來這些預測慢慢都會成為真實,果然人類的想像力是帶領我們前行的重要力量,更有趣的是下面的預測:

期許我們在假期和閒暇中,能找到如艾西莫夫的想像力,並從中一起創造未來!

合成生物學即將革命你的產業

這篇是閱讀自BCG的研究文獻摘要,關於合成生物學對於產業的影響。

from BCG Interview and research: Synthetic Biology Is About to Disrupt Your Industry

合成生物學的技術慢慢越來越成熟,幾乎各種產物都可以使用生物來製造,產業需要學習如何利用這個領域的知識來幫助其優化製程、降低成本,確保未來的產業競爭優勢。

合成生物學這名稱不重要,重要的是實質底層的意涵,生物學本質上是去研究生物體內的現象和機制,而合成生物學則是利用對這些生物體的理解來設計及應用於生產和創造。微生物本身就能產生各式各樣的化學物質,隨者我們導入合成生物學的架構和工程思維,便能大幅改善整個生產流程。

供應鏈將不在受限於原物料的供應,公司將能理用細胞、細菌等等從底層來產生這些材料,比如半克的牛肌肉細胞可以培養成好幾百磅的牛肉,這類的技術將會創造數以百計的公司。估計到2030年,整個產業的價值會超過30兆美元。

整個產業的前進,主要得益於這十年來基因修改和定序的技術進步,除了相對便宜和方便的定序進步外,使用CRISPR作為基因編輯的工具讓價錢大幅降低,加上許多技術的進步如機器自動化、人工智能等等,讓這些技術的整合能帶給製藥產業、服裝產業、農業、化學工業、能源產業等等不一樣的革新和思維。

充滿創意的產品和製程

前幾年大火的植物肉,如Impossible Foods和Beyond Meat算是掀起了歐美產業的革命(素肉在東方算是相對成熟的市場,只是沒有這波歐美公司成功的市場策略和製程),也揭示了利用合成生物學的方法可以產生什麼過去無法想像的產品類型

Company with innovative product:Impossible Foods, Beyond Meat, Innocent Meat, New Age Meats, Change Foods, Eat Just, Good Chicken, Upside Foods, Ginkgo Biowork, Joyn Bio

改善現有產品的製程和表現

新的合成生物學公司開始重新設計一些傳統原料的製程,為了建置環境友善的流程,且能不使用石油為原料,改變整個供應鏈生態,另一方面,細胞或是微生物為主的製程可以大幅提高產出率(理論值,但也相對應有許多要克服的困難,比如菌種污染、最佳化養殖條件等等)。另一方面,傳統的鍊金或是從廢棄物萃取金屬的方式會使用到大量的化學試劑,但相對使用所謂的生物浸出(Bio-leaching),利用微生物來提煉特定重金屬,則相對傳統方法是更乾淨環保的,如百年礦業集團力拓集團(Rio Tinto)、必禾必拓(BHP)開始導入生物方法來提煉金屬如銅。

Extraction and recovery of precious metals from electronic waste printed circuit boards by bioleaching acidophilic fungi, 2017

降低成本,增加稀有材料的供應

日常生活中,許多我們習以為常的原物料,取得是非常困難的或是不環境友善,比如香草精,自從1900年開始,香草精作為甜點中重要元素,使其全世界需求量越來越大,但實際上只有非常少數是從香草豆莢而來,大多數都是從不同化合物中轉化而來,百分之85是使用木餾油中的愈創木酚(Guaiacol),百分之15則是從木質素(lignin)而來。另外,在奢侈行業中的皮革,也是近年來飽受動物保護觀念而影響,逐漸希望能有替代方案,於是開始有相關的生技廠商,使用非動物性材料來創造出皮革的質感,比如Modern Meadow,便是使用可以產生膠原蛋白的酵母菌,藉此來製造成皮革材料,MycoWork公司則是利用蕈類的材質來創造皮革般質感的生物材料。

from MycoWorks website

催化更有彈性的供應鏈

隨者世界朝向低碳排等永續環境目標下,導入生物製程提供傳統行業更加環保的方案,如聖地牙哥的公司Genomatica,他們使用生物製程來產生尼龍所需的前驅物質,提供給杜邦公司作為尼龍6這個專利材料所用,主要使用微生物來發酵來自於植物的醣類,來產生這些前驅物質,而不須依賴石油,這樣的好處是可以讓製成的碳排放大幅降低。也因為是使用微生物等作為材料供應來源,整體供應鏈的彈性將遠比以前依賴石油時更為彈性。

未來這樣的產業趨勢主要由兩個東西決定:技術成熟(time to maturity)技術可接受性(diffusion)。技術成熟的時間,則跟產業能否規模化和成本相關聯,大概百分之九十的合成生物學技術,都無法規模化,規模化通常代表者菌株的選擇和優化,以酵母來說,至少要能每年60萬公升,動物細胞則是每年4萬5公升,而規模化需要時間,伴隨者就是成本的降低。技術可接受性,則跟當地法規、產業聚落、投資和產品特性央關,以及市場的選擇,是否生產目標本身極具被取代特性,這速度也跟相對於的人才供應有關。

合成生物產業改革傳統產業的方式

  • 現行產業面對新合成生物學產業的競爭,因其提供更便宜、更快的生產能力,以及相對低的環境足跡
  • 現行產業轉型往更環境友善的製程改進
  • 現行產業使用合成生物學公司所製造的新型態材料

所謂的產品替代,可能從B2B到B2C都有,在工業層級上,最主要的是BCD產業(大宗化學和特用化學產業),再來可能在往香料和調味劑方向做調整,主要根據可能的產業規模相關。

閱讀參考:

BCG: Synthetic Biology Is About to Disrupt Your Industry

使用Google App Script導入自動化流程,稍稍減輕你的行政勞務

這邊先打個預防針,再如何導入自動化管理,始終還是需要人的介入,所以最終還是會需要花些時間參與其中,但至少可以從部分重複性的勞動中解放出來,隨者我們很多行為都在電腦中操作,有時候我們會發現我們做的事情就是重複性的點擊和寄件,這時候其實這些行為也可以被自動化,這就是所謂的機器人流程自動化(Robotic Process Automation)(P.S: 假如要很…技術宅的來說明的話),從簡單的點擊自動化到判讀發報告工具等等都是這類的概念。

這是開始接手一點點行政工作的夥伴常常會遇到的情境,這邊就以醫院總醫師業務為例。

“新學期開始,你的科又要迎來新的Clerk,每週都有不同梯次的人,你也要提醒帶的醫師記得上課,又要在課後收集Clerk的作業和評分,光處理這些事物,大概就佔用到你一半以上的時間”

令人崩潰的迷因

相信身邊很多開始需要處理行政雜務的朋友,常需要做的事情就是各種提醒和收集評分表或是報告,一部分的人慢慢的會使用如Gmail, Google Form, Google doc, Google sheet等等工具導入電子化,但最煩的是日期到了你必須自己來寄信、彙整、收集。

但其實可以再往下多自動化一步。(假如你是Google工具重度使用者的話)

這邊分享一下你可以使用Google App Script來讓這些工具自動化完成,做到如下:

特定日期發信提醒上課講師,給予講師當天課程學生名單,且將評分表附在信中寄給學生或是相對應的老師!

什麼是Google App Script?

我們常常在用的如Gmail, Google Slides, Google Sheet, Google Form等等都是所謂的Google Apps,而我們使用的時候都是使用圖形化介面,在瀏覽器中開啟信箱,寫信和收信,附上郵件,在google doc上面協作,撰寫草稿,或是利用Google Slides來做簡報,使用Google Form來設計問券,這些工具就是所謂的Google App,正常情況下你就是利用滑鼠來使用,但其實最近兩年Google為了讓企業或是個人能更高效地利用,導入了所謂的Google App Script工具,讓你使用簡單的代碼,便能輕鬆的自動化這些當初用滑鼠來使用的情節,且可以輕鬆地串接每個App,讓工作流程自動化且排程化。

簡單來說,你每個建立的google doc, google slide, googlde sheet, googlde form都是一個可以用程式來調用的檔案,具有唯一的物件Id。很酷吧!

如何建立一個Google App Script檔案?

那會不會很麻煩,假如想要使用Google App Script來操控我們在google Apps裡的檔案?一點也不,你不需要安裝任何程式,或是建立整個編程環境,流程就像是你建立一個Google Doc檔案一樣。

直接在你的googld drive中,就能建立一個Google App Script檔案

編輯和撰寫Google Apps Scripts

點開你建立的Google Apps Script就會自動進入他的編輯器中,如同下面的畫面:

整個畫面就如同一個簡單的編輯器,裡面可以直接撰寫代碼來控制你的文件,主要是使用Javascript的語法,所以相對容易,你不用在自己學習新的語法和觀念,只需要搞懂Google App Scrip裡面調用Gmail, Google Sheet, Google Form的函式即可,以及你想要怎麼去串接資料來達成你想要的任務。

基本邏輯,每個Google檔案都是可以被取用的物件

第一個重要觀念在使用Google App Scripts是每一個你的google檔案,都有一串獨一無二的Id,且都是顯示在網址之中,非常一清二楚。

這邊是我每封信件的一個範本,這邊一點開,你從瀏覽器就能看到這個文件的Id,這就可以在App Script中調用,另一方面,因為Google在權限管理做得很好,所以不同帳號的人基本上是不能調用彼此文件的,所以我這邊露出這Id基本上不會讓別人可以任意修改(希望我的理解沒錯,不然….我的檔案就有危險惹)

基本範例:一個自動寄出提醒當天上課教師的Email

這個功能在做什麼呢?簡單描述一下,每天這個函數會被排程在早上八點的時候執行,執行時,他會去檢查我們的課程排程google sheet表單,看今天的日期是哪個老師上課,有老師上課的話,就是檢查另一個學生組別的google sheet,看這老師帶的組別,裡面有哪些學生,接者他再去抓取我們的問券範本google form,把這些學生的姓名和上課資料放進去問券,接者在抓取我們設計的Email範本,把相關老師姓名、學生姓名以及問券連結放上去,接者邊把這封信寄給這位老師,同時CC給我。

他會長什麼樣子呢?

基本的撰寫方式就是以寫一個函數(javascript function)的模式,然後函數內完成你想要的功能,這邊可以看到Google Apps Scripts的編輯器會自動抓取這份文件中定義的所有函數,你點選執行便能測試這些你自己撰寫的代碼。

你可以把所有要用到的檔案都放在同一個地方,這樣其實就可以很輕鬆的管理和建置你的流程,之後要交接給學弟妹也會非常方便,或是用舊的代碼來完成新的工作!

這邊分享原始代碼,給有興趣的人使用:



// 使用的代碼
// reference usage: http://www.eion.com.tw/Blogger/?Pid=1148
function autosentDOC(){
    // ======================== Basic 參數設置 ================================

    let today = new Date(); // 讀取今天的日期
    Logger.log(today); 
    Logger.log(today.toDateString()); 
    // 設定google drive中檔案的id
    // 問券:一份google form問券:用來打分數
    const form_id = '1XvhpcCV_UXDCJpIOsdaksjfo9LDwWKrkxP16sMvs' ;
    // 資料:一份google spread sheet:裡面有所有clerk的資訊,包含:姓名、梯數、開始的日期、結束的日期等等
    const sheetTeacher_id = '1tquDwugwMsy5al20f_hGChdfdsafdsGsCoXHUJF0';
    const sheetStu_id = '1EdySuvRHo3iPqdfsdfsfdsfB9Cx3sRcmFnPfdsfdo';
    // 文本:一份google doc:裡面有email的範本
    const docmd_id  = '11QphDQkYe8rdfsdfsdfeOfKlXhfQdH6bj5g';  // 內容:提醒有clerk,且要評分
    
   
    
    //const email = 'dontellyou@gmail.com' // 測試時使用自己的信箱
    // 寄信函數的參數
    const param = {
        method:'get',
        headers: {
          "Authorization":"Bearer "+ScriptApp.getOAuthToken()
        },
        muteHttpExceptions:true
      }
    // ======================== 今天上課的教學醫師 =============================
    // 讀取教學醫師的排程
    const gs_MT = SpreadsheetApp.openById(sheetTeacher_id);

    const gs_MT_sheet = gs_MT.getSheetByName('schedule');

    const gs_data = gs_MT_sheet.getDataRange().getValues();
    // 讀取學生組別資料

    const gs_Stu = SpreadsheetApp.openById(sheetStu_id);

    const gs_Stu_sheet = gs_Stu.getSheetByName('member');

    const gs_Stu_data = gs_Stu_sheet.getDataRange().getValues();
    // ======================== 從google sheet取得 Clerk的名單資料 ======

    // 讀取google drive中的google sheet 檔案
    //const ss = SpreadsheetApp.openById(sheet_id);
    // 讀取這個google sheet中的分頁,分頁名稱為2021_2022_Clerk_CPcourse
    //const sheet = ss.getSheetByName('2021_2022_Clerk_CPcourse');
    // 讀取這個分頁中的所有資料
    //const data = sheet.getDataRange().getValues();
    
    // 將資料中,所有clerk課程開始日期比今天小且clerk課程結束日期比今天晚的“所有”資料
    let currentTeachers = gs_data.filter(function(item, index, array){
      //Logger.log(item[0]); 
      let tmpDate = new Date(item[0]);
      return tmpDate.toDateString() == today.toDateString()   
      });
    // 將資料中,clerk課程開始日期比今天小且clerk課程結束日期比今天晚的“第一筆”資料
    let currentTeacher = gs_data.find(function(item, index, array){
      let tmpDate = new Date(item[0]);
      return tmpDate.toDateString() == today.toDateString()     
      });
    
  
 
    // 判斷今天有組別的話,組別名單
    
    if(currentTeachers.length == 0){
       Logger.log('今天沒有老師要上課');
    }else{
      // 假如本兩週有clerk學生,則執行下面的代碼來建立問券
        //看一下currentClerk物件內容(debug使用)
    Logger.log("todayTeacher"); 
    Logger.log(currentTeacher[3]);
    Logger.log("today group");  
    Logger.log(currentTeacher[2]); 
    Logger.log(currentTeachers); 
      // 這週有clerk,看是否是第一週
      // 這梯有clerk,且本週為要上課的日子gs_Stu_data
      const currentClerksNamesArray = gs_Stu_data.filter(function(item, index, array){
      //Logger.log(item[0]); 
      return item[0] == currentTeacher[2]   
      });

      const currentClerksNames = Array.from(currentClerksNamesArray, item => item[2]);
      Logger.log("today group names");  
      Logger.log(currentClerksNamesArray); 
      Logger.log(currentClerksNames); 
      // ======================== 修改問券的資料,根據今天之clerk名單 ==============
      // 讀取google drive中事先建立的google form
      const form = FormApp.openById(form_id) ;
      // 讀取這個google form的問題
      const items = form.getItems();
      // 一個個確認這問券中的問題
      items.forEach((item)=>{
        
        if(item.getIndex() == 0){
        // 假如是這問券的第一個問題
          const nameItem = item.asMultipleChoiceItem();
        // 將這梯的醫學生名字放進去問券第一題的選項之中
          nameItem.setChoiceValues(currentClerksNames);
          Logger.log(currentClerksNames,'名字放入問券!');
         }
        if(item.getIndex() == 1){
        // 假如是這問券的第二個問題
          const nameItem = item.asMultipleChoiceItem();
        // 將這梯的日期放到問券之中 
          nameItem.setChoiceValues([today.toDateString()]);
          Logger.log([today.toDateString()],'日期放入問券!');
        }
  
      })
      // 這梯有一學生
       //讀取email範本:有clerk學生的版本
       //const form = FormApp.openById(form_id) ; 
       const url = 'https://docs.google.com/document/d/'+docmd_id+'/export?format=html';
       let html = UrlFetchApp.fetch(url, param);
       html = html.getContentText();
       // 將信件放入老師名稱
       html = html.replace(/#teacher/g, currentTeacher[3]);
       // 將信件放入clerk名稱
       html = html.replace(/#name/g, currentClerksNames);
       // 將信件放入google form的連結
       html = html.replace(/#link/g, form.getPublishedUrl());
       // 將信件放入這梯clerk的名字
       html = html.replace(/#time/g, currentTeacher[2]);
       // 信件的主旨
       const subject = 2022 + ' 第'+currentTeacher[2]+'組'+' 檢驗醫學部-實診暨臨診-案例討論課當日評核';

       const prop = {
        htmlBody:html,
        cc:'testemail@gmail.com'
       };
       // 寄信
       GmailApp.sendEmail(currentTeacher[4], subject,'',prop);
    }
    
  }

GenomesDAO:定序你的基因,鑄造一個NFT

延續前一篇的內容社群、區塊鏈、NFT和新型態生技開源模式,但又有點展開,來分享最近看到的一個基因定序服務跟NFT結合的項目,他們初衷很單純,但卻直指目前許多DTC基因檢測產品的問題:

如何確保你的基因資料不被幫你定序的公司自由使用且販售,但又能讓你決定你是否要提供你的基因資訊給予如研究組織、藥廠、生技公司有償或是無償地使用

GenomesDAO便是最近看到一個想要解決這個問題的公司,且以一個NFT項目發行的模式來參與Web3.0的世界。他的模式蠻有趣的,整個使用流程如下:

藉由購買或是鑄造一個Geneticats的NFT後,可以使用這個NFT來兌換實體的定序採檢套組,這個套組可以寄到世界各地,你只要用這個採檢棒刮取口腔中的粘膜,把一些細胞刮下來,再寄回去,經過約14-16周的檢體處理和定序,基因資訊會完成處理,將你的序列用AMD加密的方式儲存,此時便能利用你的資料來挖礦(售予藥廠、生技公司、研究機構使用你的資訊,並且給予你$GENE幣),同時可以使用你的資料再來鑄造成另外一個生成式的藝術作品。

這類將科學主題使用NFT的風潮,其實不算少見,甚至在Narure上面還有文章再分享這個現象:

How scientists are embracing NFTs, Nicola Jones, Nature

比如哈佛大學的George Church,就把自己的基因鑄造成NFT,在去年跟他實驗室創建的基因定序公司Nebula策劃了一場NFT拍賣,這場活動則是為了要激起大家對於基因數據的意識,宣傳大於實際的意義,因為事實上Goerge Church教授的基因序列已經是共享的資訊了,他早在2005年推動的Personal Genome Project就把它自己的基因序列也一起放在這個資料庫之中。

相信未來會有越來越多新型態的生技創業模式,尤其是打破原本募資想法的流程,讓民眾參與其中!

社群、區塊鏈、NFT和新型態生技開源模式

這篇想探討的方向初看會頗奇怪,蛤,區塊鏈、NFT跟開源生技發展有什麼關係,但實際上不然,用此篇來總結最近一些關於 Web 3.0和生技產業的可能關聯和想法。

先看一下這個Twitter上仰慕許久的生技創業前輩喬納森·羅斯伯格 (Jonathan Rothberg),他一系列的生技公司從454定序儀、賣給Thermo的Iron Torrent技術、手機式手持超音波儀ButterFlyHQ、移動式MRI的Hyperfine、這兩年建立的Detest居家核酸檢測公司等等,最近他在Twitter上的Handler:

這邊有幾個有趣的地方,第一個是Rothberg購買了在以太坊上的網址並且放在他的Twitter名字上,這是常見參與區塊鏈領域的人之習慣,再來可以看到他的介紹上面有寫到Web3、DAO和NFT,因為對基因體領域的前輩多多少少都有追蹤,所以對其Twitter的變化也是很驚訝,但另一方面也是好奇這位生技前輩看到了什麼有趣的趨勢!

再往下,可以發現Jonathan Rothberg已經開始下手進入這個領域,希望使用區塊鏈的架構來進行生技領域的創業,到這邊再來分享一下最近對區塊鏈、NFT和生技領域的看法,可能就顯得合情合理了!

一開始理解Web 3.0,算是老弟的分享(他在Solana鏈經營項目,早期比特幣投資者,常常聽他分享),畢竟區塊鏈跟我之前的背景知識和日常暴露差距有點遠,但保持開放的心態去理解和學習,慢慢體會到區塊鏈技術是如網路一樣的底層技術,可以對各行各業提供支持和改變。

這一年來參與的跨國課程How to grow almost everything(HTGAA), diyBio, global biocommunity, auto open lab等等,都越發激起對於這件事的好奇和體悟,就是如何能建立一個好的社群,而區塊鏈技術對社群營造的幫助也是我專注的重點之一,如今發現基於區塊鏈所創造的Decentralized Automonous Organization, DAO(去中心化自治組織)在生技開發中的應用會是很有趣的一個模式,比如專利的授權能否結合區塊鏈等等,也有一些實際在運作的組織再以此為手段如LabDAO, VitalDAO等等。

社群是賦能單一人類重要的實體

社群的價值在科技時代完全沒有降低,反而越顯重要,且直接上升到超越傳統的標籤如職業、年紀等等,雖然新聞常常在談論AI取代人類等等,科技公司壟斷世界,但實際上人依舊是整個經濟體系中的關鍵,且比以往更容易打破壟斷和封閉,以及改變社會的某個層面,所以當某個工具能很好的聚集人群和建立社群,就會產生巨大的價值。

回過頭來思考這件事,可以發現社群模式的改變是逐步迭代的,如扶輪社、學會、協會、人民團體都是近50年來出現的社群模式,人們也因為經營或是參與這類社群而獲取或創造價值,這件事也隨者技術的改變持續演進,Kevin Kelly在2008年撰寫的這篇1000 true fans,這件事就在談論網路的出現提供創作者一個新型態的生存模式,在2008年的時候,可能連網路電商都還沒有普及,但如今2022年這類圍繞個人創作者的商業模式已經讓人們能接受,比如露天電商、社群電商、Youtuber等等,都是某種社群型態藉由科技進步而促成的。

所有賦能社群的工具都會改變人類的行為模式

回顧這十年,以台灣來說,就經歷了多個社群工具的演進,如部落格、無名、噗浪、Line群組、臉書、Instagram到現在的Discord,一個個浪潮,漸漸讓人們社群行為轉往數位,因為網路的普及,人們很容易能建立自我的內容,進而形塑群體,且網路的聊天工具,讓溝通變得非常可擴展,網路支付機制讓這個溝通及社群能形成商業閉環,甚至因網路頻寬和速度的進步,甚至能以直播串流的模式創造新的叫賣模式

NFT是區塊鏈技術上賦能和聚集社群的一種工具

相對於Kevin Kelly在2008年那篇一千個朋友,這篇cdixon的文章NFTs and A Thousand True Fans寫於2021-2-27號,則把這個概念套用在區塊鏈其中一種應用中,稱作NFT,關於NFT的定義在網路上應該有很多介紹,我的理解則是一種在區塊鏈上的應用概念,附於特定事物一個撰寫在區塊鏈上的擁有權(ownership),但實際上則有各式各樣應用,這邊節錄cdixon文章中對於NFT的定義:

NFTs are blockchain-based records that uniquely represent pieces of media. The media can be anything digital, including art, videos, music, gifs, games, text, memes, and code. NFTs contain highly trustworthy documentation of their history and origin, and can have code attached to do almost anything programmers dream up (one popular feature is code that ensures that the original creator receives royalties from secondary sales). NFTs are secured by the same technology that enabled Bitcoin to be owned by hundreds of millions of people around the world and represent hundreds of billions of dollars of value

from Cdixon, NFTs and A Thousand True Fans

所以當NFT提供另一種模式讓創作者能聚集人群,並從中分佈價值,那這就會引起另一種人類社會的變化,所以當人們說NFT只是炒作畫作時,就稍微簡化了NFT可以做的事情,那只是最簡單的一個功能。

基於區塊鏈技術所創造的人類社群:DAO

我們進而往下,在這概念下,我們可以利用區塊鏈建立一個很特別的組織架構,叫做DAO,推薦可以看一下這部影片Stanford BioE 60: Beyond Bitcoin – Decentralized Autonomous Organizations (DAOs)

相對於傳統社群建立的模式,DAO就是利用區塊鏈技術來達成社群需要的一些功能,比如資產分配、交易、決策模式等等,傳統組織架構如協會,我們可能會有一定規範才能成立,而協會的資產必須使用銀行來儲存,這些資產權利則是利用現有的行政體系來維護,擁有權則靠法律系統。

LabDAO

這個是建立於2021/12月中的一個自治組織,可以一窺他們的初衷

Our mission is to accelerate life science innovation and collaboration. We are doing this by creating new mechanisms and markets for the exchange of R&D services and scientific data. Specifically, we’re building an open-source & community-owned/operated/governed protocol where users can buy and sell research contracts, run experiments with standardized protocols, find collaborators, and securely exchange data. “an open source protocol to act as the execution layer for decentralized science"

from LabDAO, mission

推薦可以進入他們的Discord看看,裡面的知識密度頗高,在探討生物資訊、自動化、儀器開發等等主題,但有趣的是他們會以能delivery為目標來做規劃和探討,這社群是由Boris Dyakov發起,本身是在加拿大的Lunenfeld-Tanenbaum Research Institute (LTRI) 做博士候選人,因為才建立一個多月,所以非常值得在裡面多晃晃,參與這些領域匯聚的區域。

總結來說,可以體驗到區塊鏈技術將慢慢參與到下一個世代的社群建立,且這趨勢已經在生技領域可看到,換句話說,做生物資訊、生醫研究的朋友,有機會可以體驗或參與一下Web 3.0相關的社群,未來有可能我們不需要依靠如中心化醫院、政府等模式來進行生醫研究,但利用如DAO的架構來資助及推動生醫的相關研究。

2021 鐵人賽-AI, Data和生物資訊

一不小心又隔了四個月了,前陣子九月特休的時間,參與iThome鐵人賽的連續30天發文,真的是蠻硬核的,也強迫閱讀了一些之前比較少碰的部分,順便複習一下許久沒碰的東西,希望陸續把這三十篇文章的內容再更系統性整理一下,先把目錄移過來這。

2021 鐵人賽-AI, Data和生物資訊

相關之學習參考:
Resources

Talks