The 2014 fair will feature an Algae Bar at which “mock-turkey" and “pseudosteak" will be served. It won’t be bad at all (if you can dig up those premium prices), but there will be considerable psychological resistance to such an innovation.
Company with innovative product:Impossible Foods, Beyond Meat, Innocent Meat, New Age Meats, Change Foods, Eat Just, Good Chicken, Upside Foods, Ginkgo Biowork, Joyn Bio
未來這樣的產業趨勢主要由兩個東西決定:技術成熟(time to maturity)和技術可接受性(diffusion)。技術成熟的時間,則跟產業能否規模化和成本相關聯,大概百分之九十的合成生物學技術,都無法規模化,規模化通常代表者菌株的選擇和優化,以酵母來說,至少要能每年60萬公升,動物細胞則是每年4萬5公升,而規模化需要時間,伴隨者就是成本的降低。技術可接受性,則跟當地法規、產業聚落、投資和產品特性央關,以及市場的選擇,是否生產目標本身極具被取代特性,這速度也跟相對於的人才供應有關。
這邊先打個預防針,再如何導入自動化管理,始終還是需要人的介入,所以最終還是會需要花些時間參與其中,但至少可以從部分重複性的勞動中解放出來,隨者我們很多行為都在電腦中操作,有時候我們會發現我們做的事情就是重複性的點擊和寄件,這時候其實這些行為也可以被自動化,這就是所謂的機器人流程自動化(Robotic Process Automation)(P.S: 假如要很…技術宅的來說明的話),從簡單的點擊自動化到判讀發報告工具等等都是這類的概念。
相信身邊很多開始需要處理行政雜務的朋友,常需要做的事情就是各種提醒和收集評分表或是報告,一部分的人慢慢的會使用如Gmail, Google Form, Google doc, Google sheet等等工具導入電子化,但最煩的是日期到了你必須自己來寄信、彙整、收集。
但其實可以再往下多自動化一步。(假如你是Google工具重度使用者的話)
這邊分享一下你可以使用Google App Script來讓這些工具自動化完成,做到如下:
特定日期發信提醒上課講師,給予講師當天課程學生名單,且將評分表附在信中寄給學生或是相對應的老師!
什麼是Google App Script?
我們常常在用的如Gmail, Google Slides, Google Sheet, Google Form等等都是所謂的Google Apps,而我們使用的時候都是使用圖形化介面,在瀏覽器中開啟信箱,寫信和收信,附上郵件,在google doc上面協作,撰寫草稿,或是利用Google Slides來做簡報,使用Google Form來設計問券,這些工具就是所謂的Google App,正常情況下你就是利用滑鼠來使用,但其實最近兩年Google為了讓企業或是個人能更高效地利用,導入了所謂的Google App Script工具,讓你使用簡單的代碼,便能輕鬆的自動化這些當初用滑鼠來使用的情節,且可以輕鬆地串接每個App,讓工作流程自動化且排程化。
簡單來說,你每個建立的google doc, google slide, googlde sheet, googlde form都是一個可以用程式來調用的檔案,具有唯一的物件Id。很酷吧!
整個畫面就如同一個簡單的編輯器,裡面可以直接撰寫代碼來控制你的文件,主要是使用Javascript的語法,所以相對容易,你不用在自己學習新的語法和觀念,只需要搞懂Google App Scrip裡面調用Gmail, Google Sheet, Google Form的函式即可,以及你想要怎麼去串接資料來達成你想要的任務。
這一年來參與的跨國課程How to grow almost everything(HTGAA), diyBio, global biocommunity, auto open lab等等,都越發激起對於這件事的好奇和體悟,就是如何能建立一個好的社群,而區塊鏈技術對社群營造的幫助也是我專注的重點之一,如今發現基於區塊鏈所創造的Decentralized Automonous Organization, DAO(去中心化自治組織)在生技開發中的應用會是很有趣的一個模式,比如專利的授權能否結合區塊鏈等等,也有一些實際在運作的組織再以此為手段如LabDAO, VitalDAO等等。
相對於Kevin Kelly在2008年那篇一千個朋友,這篇cdixon的文章NFTs and A Thousand True Fans寫於2021-2-27號,則把這個概念套用在區塊鏈其中一種應用中,稱作NFT,關於NFT的定義在網路上應該有很多介紹,我的理解則是一種在區塊鏈上的應用概念,附於特定事物一個撰寫在區塊鏈上的擁有權(ownership),但實際上則有各式各樣應用,這邊節錄cdixon文章中對於NFT的定義:
NFTs are blockchain-based records that uniquely represent pieces of media. The media can be anything digital, including art, videos, music, gifs, games, text, memes, and code. NFTs contain highly trustworthy documentation of their history and origin, and can have code attached to do almost anything programmers dream up (one popular feature is code that ensures that the original creator receives royalties from secondary sales). NFTs are secured by the same technology that enabled Bitcoin to be owned by hundreds of millions of people around the world and represent hundreds of billions of dollars of value
Our mission is to accelerate life science innovation and collaboration. We are doing this by creating new mechanisms and markets for the exchange of R&D services and scientific data. Specifically, we’re building an open-source & community-owned/operated/governed protocol where users can buy and sell research contracts, run experiments with standardized protocols, find collaborators, and securely exchange data. “an open source protocol to act as the execution layer for decentralized science"
from LabDAO, mission
推薦可以進入他們的Discord看看,裡面的知識密度頗高,在探討生物資訊、自動化、儀器開發等等主題,但有趣的是他們會以能delivery為目標來做規劃和探討,這社群是由Boris Dyakov發起,本身是在加拿大的Lunenfeld-Tanenbaum Research Institute (LTRI) 做博士候選人,因為才建立一個多月,所以非常值得在裡面多晃晃,參與這些領域匯聚的區域。
Computer Age Statistical Inference: Algorithms, Evidence, and Data Science, 2016
The Biostar Handbook: Bioinformatics Data Analysis Guide, 2016
Bioinformatics Data Skills, 2015
Muhammad A. Alam (2019), “ECE 695E: An Introduction to Data Analysis, Design of Experiment, and Machine Learning," https://nanohub.org/resources/28817.
Talks
National Human Genome Research Institute: Machine Learning in Genomics: Tools, Resources, Clinical Applications and Ethics
而後續產業界跟學術界慢慢希望可以用實驗室開發方法的法規來適用這類的法規,所謂的體外診斷器材(IVD, In Vitro diagnostic devices)和實驗室開發方法(Lab developed test)是有一些不太一樣的地方,實驗室開發方法通常是那些進步快速的領域之檢驗項目,因為變化太快速了,要是走IVD法規路線,可能核准完市場已經變化且技術同時已經落後,這部分在次世代定序領域尤為常見。
這也是之前有概念,但沒有特別關注的議題,實際去調查真的發現蠻有趣的,所謂的假基因(Pseudogenes)是染色體上的基因片段,其跟對應的基因相似,但可能散失部分功能,目前認為他可能是細胞複製過程所產生的重複序列,在探討演化的學者這個現象很重要,可以利用Pseudogene的片段來探討種源的距離,這邊因此可以理解到這個Pseudogenes會如何影響到定序結果,一方面是來自Pseudogene的reads可能會被貼到其同源基因區域,或是者反之也會發生(OS:好複雜,難怪很多時候即時有定序資料還是看不出什麼所以然,很多因此會影響結果),在Nature Reviews Genetis 2020年12月後有一篇Overcoming challenges and dogmas to understand the functions of pseudogenes在談論如何研究pseudogene以及他在生物學的角色。
Mandelker, D., Schmidt, R., Ankala, A. et al. Navigating highly homologous genes in a molecular diagnostic setting: a resource for clinical next-generation sequencing. Genet Med18, 1282–1289 (2016). https://doi.org/10.1038/gim.2016.58
an unstable heritable element where the probability of expression of a mutant phenotype is a function of the number of copies of the mutation. That is, the replication product (progeny) of a dynamic mutation has a different likelihood of mutation than its predecessor
Usdin K, House NC, Freudenreich CH. Repeat instability during DNA repair: Insights from model systems. Crit Rev Biochem Mol Biol. 2015;50(2):142-167. doi:10.3109/10409238.2014.999192
McIvor EI, Polak U, Napierala M. New insights into repeat instability: role of RNA•DNA hybrids. RNA Biol. 2010;7(5):551-558. doi:10.4161/rna.7.5.12745
Li, D., Pan, S., Zhang, H. et al. A comprehensive microsatellite landscape of human Y-DNA at kilobase resolution. BMC Genomics22, 76 (2021). https://doi.org/10.1186/s12864-021-07389-5
Ajjugal, Y., Kolimi, N. & Rathinavelan, T. Secondary structural choice of DNA and RNA associated with CGG/CCG trinucleotide repeat expansion rationalizes the RNA misprocessing in FXTAS. Sci Rep11, 8163 (2021). https://doi.org/10.1038/s41598-021-87097-y
A genome-wide case-only test for the detection of digenic inheritance in human exomes. PNAS. 2020, 117 (32) 19367-19375; DOI: 10.1073/pnas.1920650117
The digenic causality in familial hypercholesterolemia: revising the genotype – phenotype correlations of the dsiease. Front Genet. 2021. https://doi.org/10.3389/fgene.2020.572045
Genetic modifiers and oligogenic inheritance. 2021. Cold Spring Harbor Perspectives in Medicine
相信這邊的做法有蠻多的,這邊因為前陣子因為想幫科內建立血庫分子資料庫,所以摸了一下NCBI 的Entrez Direct,就順勢使用這個工具,Entrez Direct 是美國國家生物技術資訊中心(The National Center for Biotechnology Information, NCBI)所提供的一個命令行工具,讓人可以直接使用Unix terminal的方式來針對NCBI內的各個資料庫。基本上就是下面那個下拉表單所提供的所有資料庫都可以調用。(超級佛心的,幾個代碼就可以調用全世界最大的生物資料庫QQ)
seqkit seq -n GRCh37_latest_genomic.fna.gz | grep "GRCh37.p13 Primary Assembly"| grep "NC" > primaryAssemble.lst
# only use primary assembly hg19 reference genome
seqtk subseq GRCh37_latest_genomic.fna.gz primaryAssemble.lst > onlychr_GRCh37_latest_genomic.fna
# rename the hg19 reference header and preprocess of the title
sed '/^>/d' file.fa | wc -l
sed 's/NC_.* Homo sapiens //' draft_o_onlychr_GRCh37_latest_genomic.fna > draft_1_onlychr_GRCh37_latest_genomic.fna
sed 's/, GRCh37.p13 Primary Assembly//' draft_1_onlychr_GRCh37_latest_genomic.fna > draft_2_onlychr_GRCh37_latest_genomic.fna
# get the reference sequence from bed file
seqkit subseq --bed $CRCRefAnchorBed draft_2_onlychr_GRCh37_latest_genomic.fna|\
sed 'N;s/\n/\t/' |\
sed 's/^>//' |\
sed 's/\.//' |\
sed 's/://' > $CRCrefAnchor_file
# get the reference sequence from bed file
seqkit subseq --bed $EpilepsyRefAnchorBed draft_2_onlychr_GRCh37_latest_genomic.fna |\
sed 'N;s/\n/\t/' |\
sed 's/^>//' |\
sed 's/\.//' |\
sed 's/://' > $EpilepsyAnchor_file