未分類 – 我們的基因體時代 Our "Gene"ration

哲學可能是AI 走到最後，人類最需要的

2026 年 05 月 25 日2026 年 06 月 10 日發表留言

凌晨被一個惡夢驚醒，夢裡帶者還是嬰兒的二兒子去旅遊，很緊湊的行程，跟過去一樣很長是邊走邊規劃，東摸摸西摸摸，在google地圖上面嘗試畫下想要的路線，再加上時間軸，似乎快來不及趕上某一班火車，突然冷汗直流，感覺忘了什麼事情，想到，糟糕好像把二兒子換完尿布後，放在上一間旅館的架子上面，瞬間驚恐、崩潰、各種情緒湧現，那個尿布的畫面開始放大，真希望一切沒有發生，眼睛打開雙腳一張，醒來，還好是場惡夢，早上五點，小朋友們都還在睡覺，那來繼續撰寫文字。

近期生活想起男神金城武的廣告:『世界越快，心則慢。』，仔細往下爬疏，一些往日的哲思或是閱讀過的書，開始浮現，為何又開始想這些事，可能多虧Claude, OpenAI, Gemini這些工具，賦予我更多量能，某方面讓我有一種可以更有野心去做有趣事物的感受，但另一方面，心裡則覺得需要靜下來想一想怎麼去做好歸納，我相信有些東西隨者AI出現會改變，但也有些東西，不會改變，科技進展的進步方向是不會改變，但關於人性和社會，可能始終會有某種結構，逃不出生物系統的宿命。

回到使用這些Agents來做項目，的確是可以很低成本的把一個東西做出一個簡易版本，但要深入和鑽研還是有很多改進空間，而這就會牽涉到時間分配，如何分配這件事可能還是得靠自己深入思考，總結：

做越多，不代表越好
看越多，不太表越好
想越多，不代表越好

那什麼是“好”，應該是跟個人價值觀有關，想要的人生或許就是最終的那把尺，而其中不是單純理性，還有感性的成分於其中，或許可以在擴寫。

做越多，不代表越好，看做的都是什麼
看越多，不代表越好，看你看的東西是什麼
想越多，不代表越好，看你都在想什麼

回頭來，人自己的思考還是不能被取代，或者是那句培根的：『我思故我在』。當你完全外掛功能給工具，那麼可能會跟中央極限定理的概念一樣，回歸成平均，那我們要怎麼去思考這些事呢？

想到前陣子剛做完祐生基金會的讀書會，很感謝這個機會讓我持續去讀一些書，我主要職守領域『發生學』，挑了一本書在談生物的變態與哲思，或許也可以把這個生物變態的概念放進來。

這本書裡面把從昆蟲的變態討論到一些特定魚的生物演進史，比如鰻魚，其實他有很多非常神秘的狀態，書裡面也把各種生物的變態過程用來反思一個『人為何為人』這件事情。也讓我想到卡夫卡的一本書叫變形記(Metamorphosis)，其實也是昆蟲變態那個詞，但中文翻譯把書名解釋成變形記，在談論的是原本是一家之主的男主角，本身負責家裡主要收入來源，有一天變成了一隻昆蟲，結果變成昆蟲後最在意的是明天不去上班的話工作該怎麼辦，家裡沒有人賺錢該怎麼辦，反而不是自己該怎麼辦，剛好可以跟自己目前狀態很類似，開始需要照顧小朋友，生活也是圍繞者完成別人的需求，某一刻也會想起自己年輕時候那種幾乎為自己而活的狀態，已經消失很久，那我們還算是活者嗎？

看起來，有了更好的科技和AI，我們還是得回到我們到底要什麼，假如我們讓AI決定了所有事情，那麼我們還是我們嗎？

本來想要寫寫怎麼活用AI，結果變成了自我的省思XD

最後放一個鰻魚生活史，非常有趣，這世界其實有太多值得我們探索的，有了AI，其實我們還是不能逃避自我的問題

2025 白話醫美超音波工作坊會後反思

2026 年 03 月 20 日2026 年 03 月 20 日發表留言

當超音波走進醫學美容：2025 白話超音波輔助醫美療程系列課程回顧

在一開始進入自費領域時，選擇以醫學美容為切入點，那時候觀察到的問題是標準化治療遇到客人個體化差異的問題，尤其很多儀器和工具幾乎都是廠商的教學為主，有時候講解的內容不太能說服我，比如最常見4.5mm打筋膜這件事情，實務上，每個人臉筋膜區都不同，甚至同一張臉筋膜結構都不同，以臉部為例，這是個全身軟組織變化度與組織細緻度最高的地方，而我希望能有更客觀的資訊去做評估，雖然基本上肉眼、觸診搭配一些表情變化的觀察與過去病史可以解決大部分的問題，但許多細微的狀況是需要更多資訊來做評估，甚至我慢慢發現醫美的重點之一其實是診斷與治療計劃的安排，這兩件事需要的就是越多資訊越好，於是我便在找尋適合的工具來參與，手持式超音波便成為我的首選，而手持式超音波開始有許多很好的選擇，甚至有台灣自製的超音波，結合在地廠商來解決醫學問題是我覺得很棒的模式，相對使用國外代理的工具，有在地廠商協作通常可以發揮更大的效應，於是如同之前….喜愛故意多走一步挑戰自己的個性，開始自己花錢買超音波來鑽研。

一開始很怕會造成現場的診察流程太慢，還好慢慢地……發現我本來就很慢，也傾向於討論得很精準。

當時我調查一下在醫美領域實際用超音波於醫美的現況，其實使用率很低，大部分超音波在學術上主要用來解決併發症處理，這樣的使用機率就變得很局限，另一方面，許多醫美機構講究速度，且在連鎖醫美體系主流的時代，醫師相對來說無法改動太多臨床診察模式，於是剛好利用自己所待的診所的自由度，和診所老闆的支持，開始大量在看診時使用，隨者使用的量增加，也會增加很多有趣的臨床想法，這種回饋感是我很喜歡的，不斷從小細節中來進步，一方面可以提供更好的診斷，另一方面，也不斷發現新的現象，如今回頭看，醫美領域的變化，開始擺脫流水線的模式，進入精緻與客製化，這塊一定會慢慢變成顯學。

在2025年中的時候，診所老薛開始提及能不能讓我教其他醫師超音波的使用心得，我想說趁勢勇敢的跟廠商提議直接規劃成工作坊，逼迫自己更積極的使用與把心得總結成對其他醫師有用的資訊，於是在2025年末歸化城三堂系列課程的形式，帶領小班制的學員們一起探索手持式超音波在醫美領域的臨床應用。這篇文章是一份課後回顧，也是對這段教學歷程的紀錄與反思。今年預計也會在籌辦，就用這篇做一個總結，再往前進。

為什麼醫美需要超音波？

我自己的感覺是當我開始用超音波在進行醫美診察，有種把“醫療”專業帶進去我的實踐之中，因為我可以更客觀的給予評估，同時能看到這客人過去組織做的事情，且這些客觀資訊是客人或是患者也可以看到的，老實說，這讓看診變得很有成就感，也很系統性。

學術一點或是官方一點的說法，為何醫美需要超音波評估，主要是醫學美容療程——無論是電音波、肉毒桿菌素注射、填充物施打，還是埋線拉提——都涉及對於臉部結構的理解。傳統上，我們依賴解剖知識與觸診經驗來判斷注射深度與位置，但每個人的血管走向、脂肪墊厚度、肌肉型態都存在個體差異，這些差異正是併發症發生的主要風險來源，另一方面，廠商說的什麼深度用什麼治療，其實客人間的差異是巨大的。

超音波影像的價值在於，它讓我們「看見」皮膚底下正在發生的事，對於追求安全與精準的臨床醫師而言，這不是錦上添花，而是一項日益重要的基本功。

參考國外的超音波醫美課程

而去設計這樣的課程，知道最重要的是不要自己重新做輪子，所以發現目前國外超音波課程主要有Dr. Leonie Schelke和Dr. Peter Velthuis、Dr. Barbara Parda，他們有一套教學網站和實體課程，先從線上課程的方式去觀摩，他們的架構是比較偏向對解剖學結構的理解，當然一開始我也只能從這個角度來了解，不過慢慢地發現其實有更多的可能性，比如治療前的診斷工具或是規劃工具，這塊就增加很多能讓療程效果和安全更好的能力。

課程設計理念：從下往上，由淺入深

這次系列課程以「白話」為核心精神——希望將複雜的超音波解剖與操作技巧，用直觀、易懂的方式傳達，且希望能擺脫教科書的方式，直接講實用的地方，整合成臨床模塊，也花了蠻多時間，把實際使用時得到的心得實際使用出來。課程依照臉部區域分為三堂，從下半臉一路講到上半臉，每堂課都包含三個核心環節：解剖講解、臨床應用討論、以及 Hands-on 實作，在過程中，我自己也獲得很多，也產生一些新的想法。

第一堂：下半臉（10/12）

下半臉是許多醫美療程的熱門區域，也是血管併發症的高風險區。這堂課聚焦在幾個關鍵結構：咬肌（masseter）的超音波下型態辨識與分型量測、闊頸肌（platysma）的走向，以及顏面動脈（facial artery）的路徑變異。

在臨床應用層面，我們討論了肉毒瘦臉時如何透過超音波確認咬肌厚度與邊界，以及拉提療程中如何利用影像避開重要血管。實作環節讓學員親手操作探頭，練習咬肌的分型量測——這是一個看似簡單、實則需要反覆練習才能掌握的技能。

第二堂：中臉（11/16）

中臉的解剖結構更為複雜，脂肪墊層次分明、動態肌肉交錯其間。這堂課我們深入探討了中臉脂肪墊（malar fat pad、buccal fat pad 等）的超音波辨識，以及動態肌肉在不同表情下的即時影像變化。

應用面則著重在僵化毛毛蟲（tyndall effect / filler migration）的超音波下表現與處置策略。填充物注射後的異常堆積，在超音波下有其特徵性的影像表現，這對於後續處理方案的制定非常有幫助。實作部分，學員練習了眼下結構的量測，以及填充手術前的評估與規劃。

第三堂：上半臉（12/21）

上半臉涵蓋額肌（frontalis）、顳部（temple）以及眉弓上方的 ROOF（retro-orbicularis oculi fat）等結構。這些區域在肉毒注射與填充治療中都有其獨特的挑戰：額肌的厚度與活動度直接影響肉毒劑量的選擇，而顳部的血管走向（特別是淺顳動脈及其分支）則是填充治療的安全關鍵。

臨床應用部分，我們討論了額頭眉弓治療設計與夫妻宮（temple）注射的超音波輔助策略。實作環節則聚焦在額肌分型——不同患者的額肌型態差異顯著，這直接影響治療方案的選擇。

回顧與展望

三堂課從下半臉到上半臉，我們建立了一套以超音波為核心的臉部解剖評估框架。但這只是起點。超音波在醫美領域的應用仍在快速發展中——從注射前的解剖評估、注射中的即時引導，到注射後的併發症偵測與處理，每一個環節都有超音波可以著力的空間。

身為臨床醫師，我相信「看得見」是「做得好」的前提，期待未來能繼續透過課程與臨床實踐，和更多同道一起推進超音波在醫美安全領域的應用，今年拜託剛從英國回來的林口長庚整形外科學長毛士軒醫師來指導，看能不能更來精進這個領域。

不過很開心，能跟隨自己的好奇，好好的把事情做好，當然也要很多工作上夥伴的支持

我幫你把所有本地路徑（反引號內的路徑字串）清除，保留其他所有內容。這是純文字格式的整理，不需要建立 docx。我直接把所有反引號路徑字串清除後輸出整理好的內容：

參考文獻

1. 超音波教科書 / Ultrasound Textbooks

Nelson BP, Topol E, Bhagra A, et al. Atlas of Handheld Ultrasound. 1st ed. Springer International Publishing; 2018. ISBN: 9783030088712.
Creditt A, Tozer J, Vitto M, Joyce M. Clinical Ultrasound: A Pocket Manual. 1st ed. Springer International; 2018. ISBN: 9782017961314.
Hoskins PR, Martin K, Abigail T (eds). Diagnostic Ultrasound: Physics and Equipment. 3rd ed. CRC Press (Boca Raton); 2019. ISBN: 9780367190415.
Woodward PJ, Griffith JF, Antonio GE. Imaging Anatomy: Ultrasound. 2nd ed. Elsevier; 2018. ISBN: 9780323548007.

2. 超音波臉部解剖 / Ultrasonographic Facial Anatomy

Kim HJ, Youn KH, Kim JS, Kim YS, Hong SO, Na J. Ultrasonographic Anatomy of the Face and Neck for Minimally Invasive Procedures: An Anatomic Guideline for Ultrasonography. 1st ed. Springer (Singapore); 2021. ISBN: 9789811565595.
Urdiales-Gálvez F, et al. Ultrasound in aesthetic dermatology (2021). J Cosmet Dermatol. 2021.
Ingallina F, et al. (2022).

超音波系列綜述 (Diagnostics 期刊)

Ultrasonography of the upper face. Diagnostics. 2024;14:1718.
Ultrasonography of the middle face. Diagnostics. 2024;14:2544.
Ultrasonography of the lower face. Diagnostics. 2025;15:921.
Overall diagnostics review. Diagnostics. 2024;14:1718.

3. 下半臉：咬肌 / Lower Face — Masseter

Lee HJ, et al. (2019).
Masseter muscle and botulinum toxin. Toxins. 2017;9:14.
Masseter-related review. Toxins. 2021;13:28.
Masseter-related study. JOCD. 2024;24:e70301.
Masseter-related review. Curr Pain Headache Rep. 2012;s13671-012-0013-y.
Ultrasound study on masseter muscle. Sci Rep. 2020;10:s41598-020-71378-z.

4. 下半臉：頸部、闊頸肌、頦下 / Lower Face — Cervical & Submental Region

Anatomy of the cervicomental region: insights from ultrasonography.
Kochuba L, et al. (2020).
Wollina U, et al. (2020).
Age-related changes in lower facial fat compartments and blood vessels.

5. 中臉：脂肪墊、填充物、注射安全 / Mid Face — Fat Pads, Fillers & Injection Safety

Rohrich RJ, et al. (2008). Fat compartment anatomy.
Micheels P, et al. (2017).
Polselli R, et al. (2017).
Levesque AY, et al. (2015).
Mertens DF, et al. (2016).
Shin KJ, et al. (2018).
Wen GD, et al. (2019).
Anatomic study of fillers: mimetic injections for maximum safety.
Anatomic study of fillers (duplicate copy).
Importance of choke vessels in injectable fillers.
Filler-related study. J Braz Plast Surg. 2018.
Filler ultrasonography. Aesthet Surg J.
Medicina review on fillers. Medicina. 2024;60:681.
Ultrasound in dermal fillers.
Recent filler study (2025).
Suwanchinda A, et al. (2018).
Ultrasound-guided filler management. Toxins. 2022;14:101.

6. 臉部血管解剖與安全 / Facial Vascular Anatomy & Safety

Tansatit T, et al. (2019). Facial vascular anatomy.
Tansatit T, et al. (2020). Facial vascular anatomy.
Transverse facial artery: its role in blindness after cosmetic filler and botulinum toxin.
Choi YJ, et al. (2018). Arterial anatomy.
Park JT, et al. (2022). Superficial temporal artery and zygomatico-orbital artery. BioMed Res Int.
Arterial anatomy study. J Tissue Neurol.
Filler-related complication (10-1055-s-0040-1716185).

7. 上半臉：額肌 / Upper Face — Frontalis Muscle

Frontalis muscle ultrasound anatomy. Toxins. 2025;17:594.
Frontalis muscle study. Cureus. 2024;16:e63232.
Meneses JV, et al. (2024). Increasing precision during neuromodulator injections for frontal rhytids. J Cosmet Dermatol.
Frontalis study. Ultrasonics. 2019.

8. 上半臉：眶上區 / Upper Face — Supraorbital Region

Supraorbital artery study. 2024;Article 4196.
Erdogmus S, et al. (2007). Supraorbital anatomy.
Supraorbital artery. Med Sci Monit. 2019;25:5201.
Supraorbital region. Life. 2025;15:304.

9. 上半臉：眼周肌肉 / Upper Face — Orbicularis Oculi & Periorbital

Ultrasonographic analyses of crow’s feet and novel guideline for botulinum toxin injection.
Lateral eyebrow lifting and eye-opening point injection with botulinum neurotoxin: anatomical study.
Upper face muscle ultrasound. Toxins. 2025;17:595.

10. 上半臉：皺眉肌、眉間 / Upper Face — Glabella

Wu Y, et al. (2024). A prospective and randomized study comparing ultrasound-guided real time injection (glabella). J Cosmet Dermatol.

11. 上半臉：顳部（夫妻宮）/ Upper Face — Temple

Breithaupt AD, et al. (2015).
Sykes JM, et al. (2015).
Suwanchinda A, et al. (2018). Temple injection.
Kapoor KM, et al. (2020).
Cotofana S, et al. (2020). 6 techniques for temple injection.
Hernandez CA, et al. (2020).
Temple filler safety. Front Plast Aesthet Surg. 2022.
Temple anatomy. Front Surg. 2025;12:1603177.
Yi KH, et al. (2025). Temporal fat pad filler injection for lifting purposes: shifting of the superficial temporal artery. J Cosmet Dermatol.
Temple ultrasound. Life. 2025;15:266.
Jiang J, et al. (2014). Middle temporal vein.

12. 唇部 / Lip

Venous tributaries of the lip: implications for lip filler injection.
Lip anatomy/ultrasonography. Life. 2025;15:315.

13. 埋線拉提 / Thread Lifting

Thread lifting review. Plast Reconstr Surg Glob Open. 2019;7:e2045.
Kim J, et al. (2023). Ultrasound-guided thread lifting for the prevention of parotid gland and facial nerve injury. Skin Res Technol.

14. 韌帶 / Retaining Ligaments

Lores ligament study.
Retaining ligaments / WJO. World J Orthop. 2018;9:227.

15. 肉毒桿菌素 / Botulinum Toxin (General)

Toxins review. Toxins. 2022;14:101 (v2).

共計 75 篇文獻/教科書，依主題分為 15 類。 整理日期：2026-03-20

感謝Claude Code, ChatGPT, Gemini，這幾個月發現生產力增加許多，這個對地方爸爸幫助很多，也感覺能做一些野心更大的研究！

臨床次世代定序NGS Workshop 初階和進階

2024 年 10 月 31 日發表留言

趁颱風天休息，好好來整理一下今年2024其中一個重要工作，幫忙臨床病理專科學會規劃和舉行兩場很硬的臨床基因定序相關的工作坊，一場初階，一場進階，很盡心地把每份講義根據參與者的需求來製作，也算是把住院醫師累積的東西統整分享，部分算是十年來在高通量領域的積累。

兩場活動報名都蠻熱烈的，初階課超過100人，進階課則幾乎都是領域長輩來，準備得戰戰兢兢。

初階/進階課連結

默默地變成可以幫前輩講課的講師，但也發現這塊進步的速度似乎遠超過前輩們可以理解的

除了放一些照片作為紀錄以外，也想把部分主題詳細記錄，尤其是在進階課的內容，如使用國家高速網路中心來架構分析這個主題，算是我個人覺得含金量最高的，相對內容其實在之前有分享過，但這次又重新使用，國家高速網路中心也升級很多。

使用國網中心超級電腦台灣衫建置定序分析流程（一）

使用國網中心超級電腦台灣衫建置定序分析流程（二）

在NGS進階坊中則是想把二代和三代都放進去，有手作和資料分析的部分，內容也是嘔心瀝血，耗費諸多心力，尤其是進階工作坊的Hands-on的部分，除了要去計算試劑耗材等，還要去規劃實作流程，且我們還去找尋一些不錯的廠商一起參與，還好有給力的夥伴，但每週滿滿的門診外，還要抽空規劃這些真的是有點要命，連續很多天都是下診後，做完家事吼完小朋友睡覺，才熬夜來製作，可能想要每次講課都多給一點，所以很多需要嘗試的地方，這邊列一些想細節分享的內容：

Perspective from clinical pathologist and LDTS counselor in using new sequencing technology[王信堯醫師]
Design and Implementing NGS Tests under CLSI and CAP[林庭蔚醫師] link
Overview of Specimen preparation and DNA extraction [雅瑜] link
Characteristics of current kits and methods for illumina system[均泰]
1. Current health insurance on cancer panel related to illumina
2. Comparison current illumina system and related prepared kits
3. Different preparation and kits related to final result of sequencing in tumor, blood, stool, oral swab
4. Future laboratory direction of illumina system more than genomic sequencing, such as microbiome, RNAseq or methylation
5. Semi-automation with low throughput possibility using illumina in referring test for investigating special case
Measurement for specimen and nucleic acid quality and quantity [雅瑜] link
Overview for high molecular weight nucleic acid preparation and multiplexing methods [王信堯醫師]
Library construction on high molecular weight nucleic acid[雅瑜]
Post-library construction quality measurement on short-reads and long-reads system[林庭蔚醫師] link
Loading on the third-generation sequencing machine [雅瑜]
Cloud and Bioinformatic service from Illumina ecosystem [均泰]
使用國家高速網路中心超級電腦建立生物資訊架構 Overview of the post-sequencing workflow and National Center for High-performance Computing [林庭蔚醫師] link
Investigating the high-throughput data set with tools (view fastq, fastqc, bam, VCF) [葉博]
Discuss on the real-world data with same specimen on various providers Ex [林庭蔚醫師] link

覆盤BioCreator空間-從零開始

2024 年 06 月 09 日2024 年 06 月 11 日發表留言

從2022年底開始在思考要找一個獨立空間來做為實驗室，到現在已經快一年多了，該紀錄和反思一下這段時間的思緒，有很多做不好的地方，也有些意外收穫，當初原本所有儀器都擠在居住空間的客廳，但因為小朋友出生，不能再把一些具有危險的儀器放在住的空間，避免到時候發生不必要的狀況，需要隔離空間，於是規劃一個獨立工作空間變得是一個合理的決定，於是開始找尋性價比合理的地方，另一方面，希望能持續推進這種捲起袖子實作的生活態度，畢竟這方向是自己所嚮往的。

關於如何營運一個開放空間，讓一群擁抱分享熱愛技術的人可以交流，鐵定不是一件簡單的事情，尤其領域聚焦在合成生物學相關的技術主題，包含定序、克隆、基因編輯、儀器自造等，實務上，知道亞洲文化不可能跟歐美一樣，需要有比較務實的做法，這也是請教之前在台灣做相關空間的前輩，自以為的開放開源實際上是不會有人的，最終自己的想法是“以自己想做的東西為主”，在能力時間允許下推動開放與共享。

恰好年初的時候，東京BioClub的朋友來訪，有分享關於Hackerspace的一些空間社群設計的概念，受用良多，這些經驗是產生於前十年很流行的自造者運動中，所積累的智慧，叫做Hackerspace design pattern，這些智慧和巧思可以區分成五個方向：

其中在關於如何決定何時開始弄這樣的空間，剛好可以使用Grace Hopper設計概念(最近很夯的Nvidia剛好前一代晶片就是叫Hopper)

Is now really the time to start your hackerspace? Shouldn’t you wait?Have you really thought of all the problems?

Sure it it eh time!It’s always easier to ask forgiveness than it is to get permission — Grace Hopper
It’s important to start. Many problems you think of before will banish as soon as you get start

簡單來說，就是先開始就對了，我自己則是還是覺得在自己可允許範圍內推進。

經過一番折騰，找到一個有三層的空間，每個月的租金還在可接受範圍，距離也很可以，空間的問題算是有一個解決方案，不過過程中發現真的未來要找商務空間，因為在電源這塊可能會有比較好的規劃。

於是就是一陣混亂的搬運，其中最大的工程就是自動移液模組，必須小心的由樓梯來移動，電梯可能也是未來找尋空間的一個重點，不然真的是體力累活。

開始規劃各樓層的使用，第一層是初步規劃為儲存區、電子元件設計區、試劑配置區、小實驗區，第二層則有培養室、分子實驗區，第三層就是滅菌、戶外養殖、雷切或是光固化區。

同時，在處理空間時，也參與一些去中心化科學的活動，畢竟實體空間的建置，需要一些時間，一次就位的成本會非常高，所以這空擋就可以先推動一些線上的東西，在12月的時候，趁區塊鏈週的活動，來分享一下相關的論述，的確整體是相對冷門的。

空間也慢慢有一些活動，目前還稱不上有固定班底，不過那是一個努力的方向，大部分都還是需要我的時間投入，比較沒有像是國外空間的氛圍，就是來的人大部分都是相對獨立自主，知道要做些什麼，這塊還是有文化上的差異，主動型規劃課程這塊可能是一個必要努力的方向，但到底是否收費，以及財務自主這塊也是一個待決策的部分，在同時轉換臨床工作和照顧小孩上，真的是很吃緊，不過既然是希望堅持的事情，就盡量在能力範圍內去做。

後續開始比較具體的整理，可能就是針對空間要做的活動來設計，畢竟開始有菌株，這塊在環境安全上還是要多少注意。

硬體再逐步完善的過程後，軟體層的建置後變得越來越急迫，這邊的軟體曾是指空間的知識、排程和人與人交流、項目紀錄等等都變得是後續團隊擴增的關鍵，也是趁連假開始書寫的原因。

基本軟價值的規劃，用哪些工具來紀錄在這空間發生的科學探索活動，以及為後續商業開源行為做準備，畢竟對這類型主題有興趣的人，絕對是利用這類網路相關的工具來探索和協作的。目前我自己的第一個主軸項目是From Zero to Hero: manipulation of plasmids，就是從質體放大、純化到修改的流程跑一次，中間希望可以使用到Ailurus，這間我其實關注超過三年的公司，所開發的蛋白質表達系統，其牽涉到的概念，所謂的condensate，蠻有趣的，值得藉此來多探索。

核心

BioCreator網站
IG or 臉書 or Youtube

知識和流程分享

去中心化科學與Web3 基建探索：鐵人三十天系列文章

2023 年 10 月 14 日2023 年 10 月 14 日發表留言

今年算是第三年參與痞客邦的IT鐵人賽，算是一個不錯的自我要求活動，這次想要在去中心化科學DeSci領域持續深耕，雖然區塊鏈領域在今年還是低谷，相對於2021年的瘋狂，如今留下來的是真的對這領域有興趣的搭建者，而這半年相關的IT基礎設施都有顯著的進步，尤其年初的生成式AI狂潮，基本上今年的所有焦點都在相關的項目，不論是軟體和硬體。因為科學不外乎就是資料和運算，其實AI的進步絕對會對去中心化科學領域的推進有加乘效果，今年最大的區塊鏈重點就是從單純社群建置到已開始有相關的SaaS類機制，基本上可以用來重構整體雲服務，從虛入實，算是往正向可用性前進。

最核心的表其實就是下面這張雲服務和去中心化服務的價錢：

我們的基因體時代-Web3 X 去中心化科學DeSci-探索基建序曲

Web3 X 去中心化科學DeSci – 重訪Cdixon和Web3資訊源

Web3 X 去中心化科學DeSci-重構雲服務（一）

Web3 X 去中心化科學DeSci-重構雲服務(二）

Web3 X 去中心化科學DeSci-評估去中心化儲存系統

Web3 X 去中心化科學DeSci-以Filecoin為例

Web3 X 去中心化科學DeSci-新浪潮Compute Over Data

Web3 X 去中心化科學DeSci-科學的困窘

Web3 X 去中心化科學DeSci-找尋巨大轉型目標(I)

Web3 X 去中心化科學DeSci-找尋巨大轉型目標(II)

Web3 X 去中心化科學DeSci-找尋巨大轉型目標(III)

Web3 X 去中心化科學DeSci-授權及智財機制License(I)

Web3 X 去中心化科學DeSci-授權及智財機制License(II)

Web3 X 去中心化科學DeSci-授權及智財機制License(III)-Yuga Lab & a16z

Web3 X 去中心化科學DeSci-授權及智財機制License(IV)-Molecule

Web3 X 去中心化科學DeSci-授權及智財機制License(V): VitalDAO

Web3 X 去中心化科學DeSci-授權及智財機制License(VI): ValleyDAO

Web3 X 去中心化科學DeSci-發表系統(I):科學發表的變化

Web3 X 去中心化科學DeSci-發表系統(II):當前科學發表可改善的方向

Web3 X 去中心化科學DeSci-發表系統(III): 新型態科學組織Arcadia

Web3 X 去中心化科學DeSci-發表系統(IV) or SocialFi

Web3 X 去中心化科學DeSci-發表系統(V) 案例討論-MattersLab

Web3 X 去中心化科學DeSci-數據擁有權與共享FAIR

Web3 X 去中心化科學DeSci-數據擁有權和交易(II)-FAIR4RS

Web3 X 去中心化科學DeSci-數據Protocol

Web3 X 去中心化科學DeSci-AI、社群和Web3

Web3 X 去中心化科學DeSci-Gensyn及去中心機器學習協議評估原則GHOSTLY

Web3 X 去中心化科學DeSci-AI計算與web3體系(III)-Together AI和CUDOS

Web3 X 去中心化科學DeSci-AI計算與web3體系(IV)-Akash

我們的基因體時代-Web3 X 去中心化科學DeSci-藍海世界

牛津孔洞ONT- Calling 2023-新技術更新(待完成)

2023 年 06 月 05 日2023 年 06 月 05 日發表留言

一年一度的Oxford nanopore大會又來了，假如時間不夠，可以直接聽牛津孔洞的CEO James Clarke的演講Update from Oxford Nanopore Technologies，基本上就會是今年他們火力集中的部分，大部分會議中的演講，會慢慢在他們官方的youtube頻道釋出。

簡單來說，奈米孔洞定序是一種無標記、單分子高通量的定序技術，雖然目前開始有越來越多以孔洞技術為基礎的定旭公司，但牛津奈米孔洞公司是其中的市場領頭羊，且整體使用者數量是最多的。

這三年ONT的發展方向越來越令人興奮，絕對是一個值得花心思理解的技術線，總結今年最核心的是：

專注Duplex定序的改善：
- DNA定序時候的狀況都是雙股的，但之前的定序並沒有強調雙股都會在同一次定序到，而duplex則是同一個雙股分子，兩邊都會被拉進去孔洞，將雙股的資訊互相整合，大大提高定序的正確率，尤其是如多個單序列重複狀況(Homopolymer)。
更輕鬆使用的線上分析軟體EPI2ME
- 如何有效分析高通量定序產出的資料一直是個挑戰，因為大部分團隊很難同時擁有生物資訊分析人才，所以ONT一直以來有一個EPI2ME的工具，幫助科學家較輕鬆的擁有一個圖形化介面的分析平台。
提高邊緣運算的可近性
- Dorado軟體，相容於Nvidia GPU晶片和Mac M1系列的晶片
直接RNA定序
邊緣定序硬體的推出
- 跟iPad整個的定序儀
- MKID的推出(更新原本最入門的定序儀)
自製晶片ASIC的優勢
- 透露未來定序設備將更便宜，因ONT是少數核心晶片是自己設計，而非使用現成的模組。

什麼是雙股定序duplex sequencing？

下面的圖示算是一個標準的oxford nanopore定序示意圖，通常我們的定序標的核酸，頭尾會添加上去引子(adaptor)，相對於illuminia系統來說，ONT的引子是有蛋白質的，正常情況下，其中一股會被推進去孔洞中，穿過時候產生的電訊號，就會跟其本身的A、T、C、G有關，在使用深度學習的方法轉換成序列。所以在這個狀態下，其實序列是只讀過一次，但後來ONT團隊發現有大約1.5%比例的訊號，有觀察到互補電訊號，應該是發生一股讀完後，另一股也被拉進去，如同下圖的樣子。

這樣讀兩次的現象似乎是一個可以往下發展的模式，用來優化定序的正確率，因為同一個地方被讀了兩次，要是用這兩個互補電訊號來做序列轉換，其正確率應該是可以提高，所以ONT團隊針對相關的細節優化發現可以提高到30％，光針對引子的調整就大幅提高這比例。

這塊的序列轉換就必須使用新的方法學，其實在去年年底有相關分享，不過這個duplex的概念其實是ONT之前1D2的方法學專注的地方，換句話說，他們耕耘過蠻長的時間，只是針對策略再調整。

Each signal was independently seen by the network and then decoded together https://t.co/oFQCe0SN6V
— Chris Seymour (@iiSeymour) December 6, 2022

後續優化後，甚至可以將duplex比率拉高到大於80%，換句話說，大部分你定序的核酸都被讀了兩次，這需要在建庫的流程中做很多的優化，這塊其實是很多實驗室在做ONT時常常做不好的地方，如同下面圖示，只要ligation引子的效率不好，就會直接影響到duple成功率。

目前在他們優化的試劑和晶片下，可以得到相當不錯的duplex比例！

這樣策略下，就能大幅提高定序序列的原始資料正確率，可以看到他整體的品質分數分佈都改變了，就如有常常做就會知道大部分原始資料的高點都會在20左右，所以這個對於品質分佈的提升，其實蠻恐怖的，基本上，可以想成是擁有illumina等級的正確率，而且這個正確率是獨立於序列長度的，不會說你這條讀長越長，其錯誤率越高，這也歸功於ONT並非使用光化學的方法學，會在過程中對於核酸多少有損傷，除非核酸斷裂，不然其對於DNA本身不太會有影響，另外，使用新的模式stereo轉換basecalling，其時間基本上跟之前差不多，不會因此就需要花費更多時間。從下面的圖，也可以看到最新的試劑kit14，其實在單純的單股simplex定序其正確率也有大幅上升，所以這樣的正確率真的很棒。

下面的資料則是在更長的讀長下，其品質分數和準確率間的分佈，在測試中，最長的完美讀長大概可以有40000 bp，而品質達到Q40的讀長則有達到130000bps，整體正確率可以大於99.9%，平均品質分數可以大於Q30。

針對一般模式定序在kit14下的表現

選擇性定序在P2機台

演講摘要-奇績創壇陸奇-新范式新時代新機會

2023 年 05 月 21 日2023 年 05 月 21 日發表留言

陸奇前輩的演講，總是滿滿的乾貨，可以將這次的分享和四年前的做個比較，收穫良多，前一次的主題是針對人工智能時代的創新創業浪潮。下面的文字是利用先將youtube的影片字幕複製到文字黨後，用shellscript分段貼到chatGPT，幫忙整理而成，要是串API的話，應該會更快。

現代範式的改變

這次範式變革所代表的機會是由產業發展結構所決定的，其中包括生產資源和模型知識。模型知識使得成本結構由邊際轉向固定。這次變革在技術驅動社會發展的過程中扮演多重角色，其內在結構描述了技術如何推動人類社會的進步。基於這一內在結構，我們可以分析判斷這次範式變革在未來發展的幾個層面上具有何種重要影響。首先，這次變革驅動了新一代的科學發展方式，而科學進步是人類社會進步的最根本生產力。其次，人類的經濟發展體系是技術驅動的。技術的本質是運用科學可解釋的原理和能力改變自然現象，並利用資訊轉化人力以滿足人們的需求。

數字化帶來的三位一體：感知、思考、實現

社會經濟的發展可以理解成，人、組織、社會和數字化對於人類環境所產生的系統，這系統有感知、思考和實現能力。這次數位化的範式變更將直接驅動模型和行動體系，用數位化的能力去轉化能源，將被大步的往前躍進。數位化是人的延伸，是人自我認知和能力的延伸。有了數位化的能力之後，我們將持續不斷的去改造世界。要改造世界，必須要轉換能源，並且將能源轉化為信息。能源轉化只有兩種形式，一種是用生命體系來轉化，另一種是用物理體系轉化能源。此外，能源轉化不需要必須要有物理空間，這次技術革命將更快的驅動現代的空間技術。最後，科技將不斷的加快社會的進步速度。所以這次的變革將在更大程度上讓更多的企業成為科技公司，技術將更快的驅動社會經濟發展。

三個維度的變化

人類社會進展由技術驅動，每一次重大的進展都會帶來生產力、生產關係和社會關係的變化。早期在農業社會之前，我們是遊牧民族，隨著農業技術的發明，人類生活方式在根本意義上發生了改變，我們開始定居，有了家。再後來，人類社會進入工業社會，我們開始有更多自由，儘管農業社會給我們帶來了穩定，但限制了我們的行動自由。工業社會所帶來的，是給人更多的自由度，降低了人的體力勞動。隨後，資訊社會帶來了大量的資訊，我們的產業和社會從商品經濟進入了服務經濟，我們開始使用資訊和腦力勞動來產生商業價值和社會價值。然而，今天的服務經濟也將面臨變革，因為我們所做的一切腦力勞動，除非有特殊的認知能力，都將在根本意義上被改變。因為這一次，模型的成本降低，我們將很快從一個服務經濟進入一個體驗經濟。在此過程中，我們認為創業者、科學家和藝術家等職業是最重要的，他們將帶來下一代的體驗經濟。未來，當人工智慧和數位化體系無處不在，人的體力和腦力都不再需要時，我們將進入一個我們暫且稱之為AI經濟的時代。在這個時代，我們將一起探索人的驅動力和行為將是什麼。最後，由於數位化的能力，我們是否會回到新一代的遊牧狀態，因為我們不需要在任何一個地方固定下來。

OpenAI開啟的新時代：ChatGPT

我們如何去適應這樣新的範式變革，你需要用不同的方法去思考和實踐，我們可以從這個范式的締造者當中得到重要的啟示，這一次范式轉換的到來，在技術進步的角度來講，它不是水到渠成的，而是一個突破。以目前這個範式的締造者OpenAI為例，其推出的ChatGPT在短短兩個月內擁有全球一億活躍使用者，用戶願意付費並每天使用，這在歷史上前所未有。

目前OpenAI已推出其ChatGPT最新版本GPT4，它是一種多模態、全面系統工程化開發的大模型。在GPT4之後，外掛程式推動了生態的進一步發展。 OpenAI的團隊，由300多人組成，每月、每周都在高效緊湊地進展。幾天前，微軟的團隊與OpenAI團隊緊密合作，將ChatGPT的引擎用於Bing。一個團隊如果運用新的範式核心思考，實現新的範式，其創新能力將非常大，因此，在這個時代，深入解讀OpenAI的成長歷史，他們的思考方式和實踐對我們每個人都非常重要。

新的範式背後一定有核心技術，這些核心技術使新的範式成為可能。新的範式之後，有一個新的動力引擎，這個引擎，本質上是一個模型體系，叫做GPT（Generative Pretrained Transformer），它有幾個重要的核心特性：

高效地訓練壓縮資訊，表達我們所知道的全世界的知識。壓縮的越強，其代表的知識含量就越高。
模型能夠持續提高泛化能力，在更多參數、更多Token的情況下，新的能力會湧現，包括常識推理、算術和問題解決能力。
推理能力不斷增強和被探索，包括演繹、歸納和常識推理。
對齊是關鍵。基礎模型能否使用，主要取決於是否對齊。對齊工程和研究是最活躍的科研領域和工程開發領域。對齊有幾個維度，包括對人的認知空間對齊（如語言、代碼、表格等），以及對人的價值觀對齊。
這個模型體系在現有的硬體和軟體基礎上，能夠充分利用更多的有效算力，如超級並行的GPU。

這個模型體系能夠處理重要的模態，如語言、圖像和視頻。在今天的硬件和軟件基礎之上，這個模型體系能夠充分運用更多的有效算力，如超級並行的GPU，因此模型可以使用更多的算力來發揮模型作用。

不段擴展和演化的模型

目前我們已經有足夠的模型擴展能力，如讓模型接入符號求解器，將符號運算能力接入，用這個模型學習如何使用這個工具。因為transformer是一個通用的序列建模工具，不僅可以用於語言，任何其他模態也可以用transformer來建模。大量的工具都在擴展，對於模型的擴散涌現，我們之前討論過它的多維度和可擴散性。這個引擎是這個時代背後堅定的力量，因為模型的成本會從邊際向固定走，這就是靠這個引擎。有了這個引擎之後，這個模型已經開始改變產業，並以非常高的速度將邊際成本轉向固定成本。

今天，我們可以訓練出能力不錯的大模型，例如10億甚至20億個參數，這已經足夠且可以有越來越多的應用發展，因為要使模型最終改變世界，它必須能夠在不同場景中使用，必須能夠小型化並能夠本地化。在未來，我們將在每個手機端、每個IoT設備和每輛車上使用這個模型。

GPT4封裝了我們能夠得到的所有知識，封裝了學習能力和推理能力。界面是自然語言處理，任何人都能使用，這使得今天做大模型的成本已經沒有貴到大廠不能做，而且成本在不斷的降低。

GPT4在自然語言處理的概念，採取跟過去不同的策略，過去的自然語言處理領域，基本上將處理的思路是我能通過編寫軟體理解你的一句話。但這是錯誤的，因為要理解一句話，你需要有知識。我可以分析這句話，知道這是形容詞、動詞、名詞，但關鍵是這個名詞究竟是什麼？它可能是一包香煙，加油站，你的舅舅，或是電影裡的演員，你需要全球的知識來處理自然語言，另一方面，OpenAI首先使用知識進行自然語言處理，利用知識引擎針對語言對話進行調試，而不是先理解這句話，再拉入知識。我們過去十幾年所做的，基本上是反的。但現在自然語言處理已經完全通了，因為我們都使用過ChatGPT，過去的自然語言交互都令人緊張，怕他聽不懂，稍微換一換他就不對了，但現在，你基本上隨便講，他都能懂。他有所有的知識封裝在裡面，利用這個知識作為基礎，根據對話進行調試，而不是反過來。因此，這次自然語言處理的作用非常和諧，他將在範式攀升的過程中扮演重要的角色，我們歷史上從未有過如此有效、有用、任何廠家都能使用的交互工具。

我相信GPT5和6將有跨模態的泛化能力。當然，更多的領域和應用，更多的基礎設施都在高速發展者，這個引擎的能力將越來越強這一點極其重要，因為大模型揭開了人類技術發展的新篇章。我們引入了前所未有的新物種——模型。無論是我帶到會議的50個模型，還是你給我提供的200個模型，我們都在與模型共事。模型是新物種，它的發展軌跡將決定我們的未來。在本質上，這是一種進化，就如同Brian Arthur在《技術的本質》一書中描述的，技術的進化與達爾文的自然選擇非常相似，都是結構功能組合的選擇。技術的進化選擇是滿足人類需求更多的地方，因此大模型的未來將是一個進化的未來。

這個進化過程中，我關注的主要問題是系統1和系統2。大模型目前主要基於信息系統1進行推演和推理。系統1是快速思考，或者說直覺。我們大部分時間都在用直覺，比如開車，只有在面臨大問題時，我們才會用邏輯去分析。系統1的優點是它是過程性的，可計算的，基於場景的，可以解決我們生活中的問題。而我們建立的模型，如愛因斯坦理論，牛頓理論等等，主要是系統2的模型，這些模型都是符號和數學公式，它們的優點是專業化，泛化能力強，但在我們的日常生活中幾乎沒有作用。

因此，我們需要的是系統1和系統2的組合，形成新的組合模型，能夠更有效地解決問題，在Meta模型的示意圖中，可以看到這種進化已經在發生，一代一代的模型都在湧現，我們無疑正處在這個新物種爆發的寒武紀時代，每天都有新的子物種出現。

總的來說，我們高度重視大模型以及衍生出的子模型的進化過程。今天的模型生態在某種程度上類似我們已知的生物系統，大模型就像基因，衍生出的領域模型就像表觀遺傳學，最終都是進化的過程，形成了真正的智能體系。

經濟發展格局的轉變

我們已經分享了新範式的內在結構，發展體系和所需的核心思考維度。接下來，我們將探討這個新範式帶來的新時代將如何發展。社會經濟發展是我們最關注的，其發展格局將在全球範圍內形成。這個新範式的發展速度和動力將是前所未有的，因為它改變的的生產力是知識，知識的力量無窮，是最強的生產力，改變的維度是首要的。這個生產力變得便宜，如今碼農、律師等高工資行業將受到影響，這些模型將變得越來越便宜。這個生產力將在知識密集產業如醫療產業中發揮巨大作用，用大模型技術可以提高醫生和護士的水準，提升產業生產力。

在這個過程中，模型的研發速度會加快，生產力的反覆運算速度和創新速度也將加快。因此，攀升速度將非常快。這次變革將影響到人類的每一個職業種類，每個人都將開始使用副駕駛員，等待其能力越來越強，最終變為正駕駛員autopilot。我們每個人都將擁有一個pilot team，人與人之間、人與機器之間的合作將成為未來社會企業的組織方式。

這個經濟發展格局將影響到我們每一個人的每一個工作崗位。變革的先鋒將是數字化產業，它將開拓新的商業價值。整個數位化產業將全面提高和更新，我們將擁有新的核心技術堆疊、新的平臺、新的基礎設施、新的算力體系、新的通訊體系以及新的產品開發體系，一切都將以大模型時代為主。

數位化產業的發展將影響所有行業，每個行業都將系統性、結構性地遷移到未來狀態。模型將改變知識結構成本，從邊際成本轉向固定成本。未來企業需要重新評估各項開支，以適應這一變革。我們可以預見，使用大模型技術將提高各行業產出，如軟體、設計、分析等領域的需求將大大增加。最後，根據每個產業的特點，我們可以預測未來每個行業的結構性變更將從哪個方向發展，以什麼樣的速度來發展。

我們可以想像，利用大模型技術，可以顯著提升程式設計人員、設計師、分析師以及醫生等各行業工作人員的產出。每個行業結構性的變更，都將根據不同的方向和速度進行。同時，政府的參與和監管將更加積極，特別是在安全、數據隱私和社會穩定方面。例如，OpenAI在美國和歐盟地區的發展，政府出臺的早期參與就表現得尤為顯著。此次變更需要社會產業與政府進行更多互動，尤其在早期扶持和引導基礎設施投入，以及全球性的發展上。

OpenAI產業生態系的形成

OpenAI產業生態，現在正在高速發展，其生態結構已經形成，因為它目前領先不少。它的平臺就是GPT，現在是GPT 4。OpenAI的後台開發出了新的模型，前臺是ChatGPT，它是一個人類歷史上從未有過的自然語言交互介面。同時，它還有一個可擴展介面，就是ChatGPT Plugin，已經有大量的應用可以在這個平台上開發。人類歷史上從未有過自然語言交互的介面，比如ChatGPT。同時，ChatGPT也做了一個平臺的可延伸介面，即ChatGPT Plugin，已經有許多應用在此基礎上開發。OpenAI前後台每天都有大量的應用在被開放，OpenAI自己也有一個完整的生態佈局，通過投資以及與YC的關係驅動，生態的健康成長是當前最關鍵的，這是我想與大家分享最重要的資訊。在數位化產業的發展中，開發者的介面和生態是最重要的。

接下來我們討論模型開發。基礎模型開發沒有生意可做，因為都是大廠自研，但它非常重要。我們必須理解追求大模型的路線圖。模型開發有幾個關鍵環節，首先是數據體系，包括數據集、語料、標註系統、標註工具和數據開發管線。其次是模型體系，其中有參數深度、模態和token等因素。第三是集群體系，需要合理地組合算力資源。在大模型時代，我們需要的不是伺服器，而是幾萬張卡在一起，每張卡必須能直接訪問記憶體。訓練體系也很重要，包括指令調試、正則化、Epoch、損失函數、對齊體系以及安全體系。有了這些基礎，我們就可以構建一個系統化的工程體系，進入一個持續反覆運算進展的狀態。

最後，讓我們看看大模型之後的領域模型，基於已有的大模型，我們可以通過知識蒸餾、微調或提示等方法進行優化。最近的熱門話題是參數有效的微調，通過少數GPU和足夠的token，就可以微調出一個相當不錯的模型。

我們採用知識蒸餾、微調和提示等方法進行模型優化。最近，PEFT和參數有效的微調技術，例如小LoRA，受到了大家的熱烈追捧，尤其是在開源世界。只需少量的GPU和足夠的token，就能微調出一個相當不錯的模型。數據集中包含了語言學數據和知識圖譜數據，都是很重要的資源。

新一代的API和服務公司如雨後春筍般嶄露頭角，其中，由斯坦福的PhD Lamani創辦的公司值得我們關注。因為在開發領域模型的過程中，我們需要各種開發方法，包括多模態開發，例如Midjourney正在進行的二維圖像、視頻和遊戲資產生成專案。

目前，主要依賴擴散模型，如stability和LoRA Controlnet，但這些都還在早期，需要大量的工作去形成穩定的持續攀升狀態。隨著大量工具公司的加入，我們的產能會提高。領域模型的進展也相當激動人心，尤其是在參數優越的微調方面，近幾周的進展非常快，出現了很多開源的大模型。輕模型可以運用到端上，利用知識蒸餾、數據蒸餾、結構優化和量化縮小等手段優化。長期來看，我們必須將大模型用到端上，這需要大量的研發工作。

開源模型的角色

最後，我們非常關注開源，因為開源是降低整個創新門檻的關鍵。 LLaMA體系是開源體系中最活躍的部分，它的衍生品LLaMA adapter引起了很大關注。小模型也非常活躍，同時，Databricks、Cerebas、Mosaic AI等公司也表現出色。我非常高興看到美國有許多活躍且有志向的創業者在探索開源模型，開源數據非常重要。英語是人類歷史上第一個真正的全球語言，我們的語言模型需要大量的英語語料，如common crawl、Wikipedia、書籍、文章數據等。

在模型開發方面，我們還在早期，但已有大量的進展。大模型、領域模型、邊緣模型和開源模型都在同步開發，更重要的是，開發應用也在同步進行。基礎開發代碼的工作流、代理機制提示調試和記憶embedding都需要我們關注，因為有大量的應用需要開發。

我把開發能力的拓展叫做自然語言寫代碼，這是非常重要的，我們可以通過試用不同的提示，使用自然語言形成一個抽象的知識結構，並根據需要進行推理和規劃，這個探索空間實在太重要了，我們歷史上從來沒有過讓每個人都能通過自然語言進行開發的機制，當前的框架還不夠穩定，我們需要更完整、更可靠、更穩定的工具，但這隻是時間問題，一定會發生。

我們需要開發對象，運行時非常重要。後端雲服務是目前最常見的運行環境，大部分開發都在雲端進行，原來的SAAS正在逐步變成MAAS，在手機端和移動端上開發一個繁榮的開發生態系統，有新機會等待大廠和有勇氣的創業者，IOT端也很重要，因為大模型必須要在每一個埠都能落地，為其他開發者生態提供長期的機會，吳恩達的課和Oreilly的課都值得關注，預計會有很多書、論文和Github repo上的代碼與數據，未來發展速度和寬度取決於開發堆疊，誰搶佔開發者心智，誰掌握著未來的大量發言權。

新范式下的機會

技術驅動能力很重要，范式擴散需要三個方面：科研、高品質代碼和商業化。政府也很早參與其中，全球主要有兩個地區：美國北美和中國，這次擴散與個人密切相關，聰明勤奮努力的人會學會使用這個工具，個人的行為如學習、探索、創新變得至關重要，無論你是創業者、創作者、程式師還是科學家。這次認知能力工具的擴散會拉開人與人之間的距離，與個人有很大關係。那些聰明、勤奮、努力學會使用這個工具的人，會很快拉開與同等水準的人的距離。

創業公司應著眼於系統性探索，關注創始人團隊的心力、願力和能力，引入新的人才和建立組織文化，形成一個強盛的體系。早期的重點是開發各種能力，包括技術能力、產品能力、交付能力、增長能力、商業價值能力和獲取資本能力，長期去實現它的價值空間。

我們需要思考如何掌握這個機會，首先，不要盲目追求熱度，需要思考清楚再行動。其次，勤於學習，這次新的範式是複雜的，需要多次理解才能真正掌握。最後，一旦想明白，必須行動，因為這次的變革是“不進則退”。

對於一個企業，存在三個考慮維度。第一，你的產品和業務是否有新的機會，如何探索其中的風險; 第二，你所在的產業是否正在經歷根本性的變革，你是否應該佔據新的市場位置; 第三，你所在產業的研發體系和能力是否徹底轉變，你是否需要換一個全新的思路去做事。

我們為大家提供了一個系統性的框架，這個框架包含三個機會板塊，我們用這個框架來指導所有的投資和與創業公司或創業者的互動。第一，人類的本質是認識世界並改造世界，人類是一個減熵的物種; 第二，我們通過數位化來擴展自身，因此數位化是一大機會，它驅動著整個人類的進步，包括基礎設施平臺和數位化應用兩個子板塊; 第三，改變世界的力量來自能源、生命科學、材料科學和空間科學。

閱讀參考：

@0xthefool的twitter串

最佳拍檔完整精修字幕版 youtube連結

精準醫學邀請演講：臨床定序技術與分子診斷-由短到長、一代到三代 (二）

2023 年 05 月 03 日發表留言

這篇接續精準醫學邀請演講：臨床定序技術與分子診斷-由短到長、一代到三代 (ㄧ）的內容。

上一部分大概分享到了病生理學的部分，從單位點的變化，要開始往下去分享一些人類基因序列的模式。

短串聯重複(Short Tandem Repeats)和微衛星(Microsatellites)

短串聯重複（Short Tandem Repeats，簡稱STRs）和微衛星（Microsatellites）這兩個在形容基因組結構的名詞，其實本質上是一樣的，但在體細胞談論遺傳時，都是以短串聯重複STRs為主，而在腫瘤領域在探討這類短片段重複的序列特性，則是在。它們都指的是一段由短的核苷酸序列（通常為2-6個核苷酸）構成的重複單元在基因組中連續出現的區域。

STRs的特性其實是其重複單元會造成DNA複製過程中的滑移（slippage）現象。當DNA聚合酶在複製過程中失去與模板DNA的配對時，可能會引起滑移，導致重複單元的增加或減少。這使得STRs在不同個體間具有高度的多態性，為遺傳學和人類遺傳病的研究提供了重要的信息。

由於STRs的多態性，它們在生物學和醫學上具有多種應用。在法醫學中，STRs被廣泛用作DNA指紋圖識別，用於確定遺傳親子關係、個體辨認以及犯罪現場物證分析。在人類遺傳病研究中，部分STRs與特定的遺傳病相關，如亨廷頓舞蹈症和類固醇21-羥酸缺乏症等。

然而，STRs在基因組中的功能仍然不完全清楚，如同前面一篇文章有分享到其實到2022年才有第一個完整的人類基因參考序列，那當然這類複雜基因序列在族群中的特性才開始能慢慢去理解。有研究表明，某些STRs位於基因的調控區域，可能影響基因表達，而其他STRs位於蛋白質編碼區域，可能影響蛋白質結構和功能。隨著對基因組結構和功能的進一步研究，STRs在遺傳學和基因組學領域的作用和重要性可能會得到更多闡釋。

從這邊文獻中，可以看到一些有趣的數據，比如STR目前定義是1-6bps的重複片段，而從這邊可以看出來，主要以6bp的重複片段所佔的比如最高，其中又以A是最常見的序列。

從上面的統計圖表，可以知道最常見的重複數量大概是在30次以下，位在外顯子上的比例是最小的，最多的就是在飛機因區域，再來則是基因內的內顯子區域。不過有重複序列可以到2866次，這個重複數量是很難想像的。

而這樣的重複片段在不同基因結構的區域，其實也有不少相關疾病被知道，比如上面圖片來自Hannan, A. J. (2018). Tandem repeats mediating genetic plasticity in health and disease. Nature Reviews Genetics, 19(5), 286-298.文章，便可以看到下面相關的疾病：

短串聯重複（Short Tandem Repeats，STRs）在基因組中具有高度變異性，與某些遺傳性疾病密切相關。以下是幾個與STRs相關的遺傳疾病範例：

亨廷頓舞蹈症（Huntington’s disease）：這是一種神經退行性疾病，由於CAG三核苷酸重複序列在HTT基因中過多重複，導致胺基酸葡萄糖胺在亨廷頓蛋白中過多積累，進而引起神經細胞功能障礙和死亡。
類固醇21-羥酸缺乏症（Congenital Adrenal Hyperplasia）：這是一種常染色體隱性遺傳病，與CYP21A2基因的STRs變異相關。當重複序列中的CYP21A2基因發生變異時，可能導致腎上腺皮質激素合成受阻。
慢性肌無力（Myotonic Dystrophy）：這是一種肌肉失去力量和無法放鬆的遺傳性疾病。在第一型慢性肌無力（DM1）中，DMPK基因內的CTG三核苷酸重複過多，導致異常的mRNA積累，從而影響肌肉細胞功能。在第二型慢性肌無力（DM2）中，則是由於ZNF9基因內的CCTG四核苷酸重複過多。
弗里德勒依託病（Friedreich’s Ataxia）：這是一種神經退行性疾病，與FXN基因中的GAA三核苷酸重複過多相關。這種重複可能導致鐵依賴型抗氧化酶（frataxin）的缺乏，進一步引起神經細胞和心臟細胞的損傷。
極端X綜合症（Fragile X Syndrome）：這是一種智力障礙和行為異常的遺傳性疾病，與FMR1基因中CGG三核苷酸重
脊髓小腦萎縮症（Spinocerebellar Ataxias，SCAs）：這是一組神經退行性疾病，影響脊髓和小腦。多種SCAs與STRs變異有關，例如SCA1（CAG重複於ATXN1基因）、SCA2（CAG重複於ATXN2基因）、SCA3（CAG重複於ATXN3基因）等。
肺泡蛋白病（Pulmonary Alveolar Proteinosis，PAP）：此疾病與CSF2RA基因中的STRs變異相關。該變異導致肺泡巨噬細胞功能異常，進而引起肺泡內蛋白質過度積累。
黑尿症（Alkaptonuria）：這是一種代謝性疾病，與HGD基因中的STRs變異相關。這種變異導致同尿苯酸氧化酶（homogentisate 1,2-dioxygenase）的功能缺陷，使尿中的同尿苯酸無法正常代謝，進而導致黑尿和其他相關症狀。
骨化性纖維組織病（Fibrodysplasia Ossificans Progressiva，FOP）：這是一種極為罕見的遺傳性疾病，與ACVR1基因中的STRs變異相關。該變異導致骨骼肌纖維被骨組織所取代，造成肌肉僵硬和關節活動受限。
肺動脈高壓（Pulmonary Arterial Hypertension，PAH）：這是一種影響肺血管的疾病，與BMPR2基因中的STRs變異相關。該變異導致骨形成蛋白受體2（bone morphogenetic protein receptor type 2）的功能缺陷，使肺動脈壓力上升，進而引起心臟負擔加重。

拷貝數變異(Copy Number Variants)：在長一點的重複序列

上面的短串聯重複片段(STRs)，既然叫做“短”，那麼就有在長一點點的重複序列特徵，那麼就會被歸類在所謂的拷貝數變異，歸類在更大範圍的結構變化(Structual Variation)，換句話說，拷貝數變異(Copy Number Variants)涵蓋了一個相對廣泛的基因組片段大小範，從數百個核苷酸（bp）到數百萬個核苷酸（bp）不等。這些變異可以是重複（增加拷貝數）或缺失（減少拷貝數）。然而，CNVs的精確大小範圍會根據定義和檢測方法而有所不同。一些研究將CNVs定義為影響至少1,000個核苷酸（1 kb）的變異，而其他研究則將閾值設置為50,000個核苷酸（50 kb）或更大。隨著檢測技術的不斷進步，研究人員現在能夠在更細的尺度上檢測到更小的CNVs，進一步擴大了我們對這些變異的認識和研究範疇。

P.S: 這也是為什麼在理解基因體學的時候，一定要搭配對於技術的理解，很多時候，如同以管窺天，我們就會以為天就是圓的。

圖片來自於Phenotypic impact of genomic structural variation: insights from and for human disease, Nature Genetics Review, 2013

臨床上，用來做這類大片段變異的工具，最常見的就是產前檢查的項目，如基因晶片ArrayCGH等，偏向在新生兒遺傳異常的偵測，但成人上相對就還沒有臨床應用，與CNVs相關的疾病涵蓋了許多不同的領域，包括神經發育障礙、精神疾病、自閉症和其他遺傳病。以下是一些與CNVs相關的疾病範例：

神經發育障礙：部分學習障礙和智力障礙與CNVs有關。例如，部分Williams症候群（一種罕見的神經發育病）患者的基因組中，某個區域的拷貝數減少。
精神疾病：與精神分裂症相關的多個CNVs已被發現，包括1q21.1、15q11.2、15q13.3和22q11.21等區域的拷貝數變異。
自閉症譜系障礙：已經確定了與自閉症相關的多個CNVs，如16p11.2、22q13.3和15q11-13等區域的拷貝數變異。
遺傳病：某些遺傳病也與CNVs有關，例如Charcot-Marie-Tooth病（一種遺傳性神經病）中，17p12區域的拷貝數變異與疾病的發生有關。
免疫缺陷病：部分免疫缺陷病也與CNVs相關，如DiGeorge症候群（一種罕見的免疫缺陷病），在22q11.2區域的拷貝數減少與疾病的發生有關。
癌症：在某些癌症患者中，已經觀察到了特定基因的拷貝數變異。例如，乳腺癌中的ERBB2（又稱HER2）基因放大與腫瘤的惡性程度有關。

這邊其實也會觀察到有些複雜的疾病表型，如小胖威力Willian syndrome，就有多種可能會造成，這也代表者疾病定義在未來可能會需要調整和精進。

from A copy number variation map of the human genome, 2015, Nature Genetics Review

上面這張圖，則是展現了已知CNV在人類基因組上的分佈情況，另一方面，也暗示了不同人類染色體其上基因序列複雜度也是不太一樣，性染色體、染色體22號、染色體16號、染色體15號、染色體9號等等都是相對來說發現比較多拷貝數變化的染色體。

上面的圖片則是進一步介紹不同CNVs在特定功能區域的分佈，很明顯可以看到在non-coding基因區域、CpG island、Promoters都是比較多的，暗示者其在參與基因調控上扮演的角色較重。下面的分析則是進一步用CNVs所在區域的已知功能，做關聯性的分析，似乎也可以看到更比較複雜的生物功能有關，如免疫、染色體結構等等。

更複雜的3D 基因體結構

2015. Inching toward the 3D genome. Science

你以為基因體學就停在對於序列的模式和異常嗎？其實人類越探索，就越發現其中的複雜，最近幾年因為基因定序的進步，認為染色體在細胞核中的折疊和排列，本身就會對於基因產生複雜的調控。這領域稱作3D基因體學（3D genomics），或是空間基因體學，是一個新興的研究領域，旨在研究基因組在三維空間中的組織和折疊結構，以及這些結構對基因調控和基因組功能的影響。

3D基因體學的主要概念包括以下幾個方面：

染色體領域（Chromosome Territories）：在細胞核中，不同的染色體被發現佔據了自己獨特的空間區域，稱為染色體領域。這些領域有助於維持基因組的穩定性和遺傳信息的整合。
染色體組織域（Chromatin Domains）：染色質被組織成一個分層的結構。在這個結構中，相鄰的基因區域可能因為染色質折疊而相互作用，從而促使協同調控的基因共享調控元件。
開放染色質區域（Open Chromatin Regions）：開放染色質區域是指在基因組中易於轉錄因子和其他調控因子結合的區域。這些區域通常與基因的啟動子、增強子或其他調控元件相關。
染色質互作（Chromatin Interactions）：基因組中不同區域之間會發生物理接觸，這些接觸有助於調控基因表達。例如，增強子和啟動子之間的互作可以調控特定基因的表達。

為了研究3D基因體組織，科學家們已經開發了多種實驗方法，如染色體共閘定（Chromosome Conformation Capture，3C）技術及其衍生技術（如4C、5C和Hi-C）。這些方法允許研究人員獲得基因組在三維空間中的組織信息，並揭示染色質互作和基因調控的機制，這些方法目前都是停留在研究技術，當然也代表者離臨床距離較遠，但這代表我們必須理解從基因到表型的距離，還牽涉到這麼多東西。

隨著3D基因體學研究的深入，有很多這領域的發現和提出的概念，當然，要知道的就是這些概念都是伴隨者檢驗技術所生的，必定有其侷限之處：

TADs（Topologically Associating Domains）：基因組中的特定區域在三維空間中被發現存在高度自我聯結的結構，稱為TADs。TADs的結構與基因調控密切相關，因為它們使得調控元件（如增強子）能夠更容易地與目標基因接觸。
染色質環（Chromatin Loops）：在染色質折疊的過程中，某些區域（如增強子和啟動子）被拉近並形成物理上的接觸，形成染色質環。這種結構有助於協調基因表達和精確地調控基因活性。
細胞類型特異性的3D組織：不同細胞類型之間的基因組組織可能存在差異。這些差異可能影響基因表達的調控，並有助於維持細胞特性和功能。
3D基因體學與疾病：基因組組織的改變可能導致疾病。例如，某些癌症中的染色質重排可能導致調控元件錯誤地與目標基因互作，從而導致基因的過度表達或失活。

總之，3D基因體學是一個新興且快速發展的研究領域，它對我們理解基因調控和基因組功能有著重要的意義。雖然目前還在探索跟疾病的關聯，但這些是知道跟基因組立體結構相關的疾病：

癌症：某些癌症中的染色質重排可能導致調控元件（如增強子）與錯誤的目標基因互作，從而導致基因的過度表達或失活。例如，某些白血病（如急性淋巴細胞性白血病）與基因重排導致的染色質環異常有關。
神經發育障礙：染色質環和TADs在神經發育過程中的基因調控中也起著關鍵作用。某些神經發育障礙（如自閉症、智力障礙和精神分裂症）與這些結構的異常有關。
先天畸形：某些先天性疾病，如林茨（Limb-Body Wall Complex，LBWC）綜合徵和菲林-麥克德蒙德（Feingold-McKusick）綜合徵，與基因調控元件（如增強子）在染色質環或TADs中的異常定位有關。
罕見遺傳病：某些罕見遺傳性疾病，如Facioscapulohumeral Muscular Dystrophy（FSHD），也與染色質環或TADs的異常有關。FSHD與染色質結構中D4Z4重複序列的減少有關，這可能導致調控元件與錯誤的基因互作，進而引起疾病。

閱讀參考

跟拷貝數變異相關的文獻

Redon, R., Ishikawa, S., Fitch, K.R., Feuk, L., Perry, G.H., Andrews, T.D., Fiegler, H., Shapero, M.H., Carson, A.R., Chen, W., Cho, E.K., Dallaire, S., Freeman, J.L., Gonzalez, J.R., Gratacos, M., Huang, J., Kalaitzopoulos, D., Komura, D., MacDonald, J.R., Marshall, C.R., Mei, R., Montgomery, L., Nishimura, K., Okamura, K., Shen, F., Somerville, M.J., Tchinda, J., Valsesia, A., Woodwark, C., Yang, F., Zhang, J., Zerjal, T., Zhang, J., Armengol, L., Conrad, D.F., Estivill, X., Tyler-Smith, C., Carter, N.P., Aburatani, H., Lee, C., Jones, K.W., Scherer, S.W., & Hurles, M.E. (2006). “Global variation in copy number in the human genome." Nature, 444(7118), 444-454.
Stankiewicz, P., & Lupski, J.R. (2010). “Structural Variation in the Human Genome and its Role in Disease." Annual Review of Medicine, 61, 437-455.
Weischenfeldt, J., Symmons, O., Spitz, F., & Korbel, J.O. (2013). “Phenotypic Impact of Genomic Structural Variation: Insights from and for Human Disease." Nature Reviews Genetics, 14(2), 125-138.
Zarrei, M., MacDonald, J.R., Merico, D., & Scherer, S.W. (2015). “A Copy Number Variation Map of the Human Genome." Nature Reviews Genetics, 16(3), 172-183.

跟3D基因體學相關的文獻

Dekker, J., Marti-Renom, M. A., & Mirny, L. A. (2013). Exploring the three-dimensional organization of genomes: interpreting chromatin interaction data. Nature Reviews Genetics, 14(6), 390-403.
Lieberman-Aiden, E., van Berkum, N. L., Williams, L., Imakaev, M., Ragoczy, T., Telling, A., … & Dekker, J. (2009). Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science, 326(5950), 289-293.
Dixon, J. R., Selvaraj, S., Yue, F., Kim, A., Li, Y., Shen, Y., … & Ren, B. (2012). Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature, 485(7398), 376-380.
Rao, S. S., Huntley, M. H., Durand, N. C., Stamenova, E. K., Bochkov, I. D., Robinson, J. T., … & Aiden, E. L. (2014). A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell, 159(7), 1665-1680.
Bonev, B., & Cavalli, G. (2016). Organization and function of the 3D genome. Nature Reviews Genetics, 17(11), 661-678.

精準醫學邀請演講：臨床定序技術與分子診斷-由短到長、一代到三代 (ㄧ）

2023 年 04 月 30 日2023 年 05 月 01 日發表留言

前陣子被邀請去精準醫學學會的課程做分享，一開始被指定的是講三代定序，但感覺直接跳到這麼深的技術層面分享，對於聽者比較沒有意義，所以就稍微調整主題，希望讓與會的同仁可以有一個比較全面的收穫，且激起他們的興趣。

為何現在是一個基因定序百花齊放的時代

通常分享基因體學定序技術，都要由價錢的概念來講，畢竟這可以給人一個明確的感受，關於這技術是否可以跳脫如學術研究的框架，進入比較實務應用的階段。

根據美國國立衛生研究院（NIH）的數據，基因定序價格隨著時間的推移顯著下降，又上的圖表算是一張非常經典的圖，就像晶片產業我們會用摩爾定序，但在生物技術領域這塊的進步則遠遠快過摩爾定律。

在1980-2000年間，定序一個人類基因組的成本非常高昂，2001年，第一個人類基因組計畫完成，該計畫耗資約27億美元，我們可以想像在這時刻，要定序一個人類這樣的金額其實就是蓋一棟摩天大樓的費用，而且還需要費時十年以上。

2010年，隨著高通量定序技術（Next-Generation Sequencing, NGS）的推廣和應用，基因定序價格進一步降低。當時，定序一個人類基因組的成本已降至數萬美元，但此時的成本其實讓此技術是國內一線研究團隊相對可承受，但普遍研究學者是無法碰觸的。

到了2021年，基因定序價格再次大幅下降，使得定序一個人類基因組的成本已經低至1000美元以下。如今，價格進一步降低，去年（2022年），大概小於100美元就能定序一個人類的基因組，可以看出，基因定序價格的下降在很大程度上促使了這項技術的普及。隨著價格不斷降低，越來越多的人可以接觸到基因定序技術，從而推動了醫療、科研等領域的創新與發展。

定序只是技術，重要的是理解背後人類基因序列的病生理學

很多朋友在理解基因定序的技術時，可能過度專注在定序技術，而忘記他是用來捕捉底層生物分子層面的生理學，所以這邊我反而會花多一點時間分享人類基因體裡面有什麼現象，不同的特徵，其實造成某些定序基因可能無法捕捉，這時候就能建立腦中一個重要觀念：『哪些是我們看不到的，或是侷限』，因為這就是在跟民眾解釋或是理解這些資訊時重要的概念。

以林口長庚檢驗醫學部有的分子檢驗項目為例，分享這個列表的重點就是要給在座的同人一個感覺，因為不同的機構，所能提供的服務不太一樣，而這樣的限制則是每個人在自己工作場域中要去理解和因此做出調整的。另一個想分享的重點是隨者基因定序價錢降低，有的時候關鍵障礙其實是人員對於新技術的接受，以及是否有多餘的時間來適應，換句話說，未來很大機率不一定是傳統的醫學中心實際來執行比較新穎的檢驗檢查，可能開始會是外面專門的檢驗公司或是廠商來提供服務。

下面是2022年底林口長庚簡單的分子檢驗項目粗略地整理：

親子鑒定| 嵌合體檢驗：短縱列重複序列(STR)
胎兒檢查
- 染色體數量異常
  - 無創產前遺傳檢驗
- 拷貝數異常
  - 晶片式全基因體定量分析
免疫分型
- HLA高解析定序(A,B,C)、HLA-B*15:02、HLA-B27
遺傳性疾病
- 單基因位點變異
  - 乙型地中海貧血、肌力不全SGCE/DYT1/GCH1基因、涎酸酵素缺乏症NEU1、汝南氏症候群PTPN11基因檢測、急性間歇性紫質症HMBS基因檢測、APOE基因檢測
- 短片段變異
  - 甲型地中海性貧血
- 拷貝數變異
  - 海洋性貧血
- 短縱列重複序列(STR)
  - 亨丁氏舞蹈、脊椎性萎縮症、小腦萎縮症、C9orf72六鹼基重複基因檢測、X染色體脆折症FMR1基因、眼咽型肌肉萎縮症(PABPN1)…
複雜疾病或體質
- 單位點變異
  - 肥胖基因檢測(MassArray)
  - 聽損基因檢測(MassArray)
  - 標準及進階型酒精代謝基因檢測(ADH1B rs1229984, ALDH2 rs671)
  - 癲癇基因檢驗套組(NGS)
腫瘤
- BRCA1/BRCA2乳癌基因定序(NGS)
- 遺傳性大腸直腸癌30基因檢測(NGS)
- 重點型癌症標靶藥物基因檢測(NGS)
- 廣泛型癌症標榜藥物基因檢測(NGS)
- 行動基因循環腫瘤DNA檢測(NGS)
- K-RAS、EGFR、ROS1、Her2、PDGFRA、PIK3CA、ALL-RAS基因檢測(腫瘤組織)
- MGMT甲基化程度偵測
- 微衛星體不穩定檢測(NGS)
- 周邊血游離DNA EGFR T790M
- 螢光雜交ALK, 1p19 deletion, MYC, BCL2, BCL6
感染症
- 症候群病原菌檢測
  - 腦膜炎ME Panel
  - 肺炎Pneumonia Panel
- 病毒核酸檢驗定性
  - BKV, Bordetella pertussisi, ParvoB19, Enterovirus 71 RNA, HPV16/18,12, Varcella Zoster Virus, 腸病毒、登革熱、麻疹病毒、腸病毒68型、新冠病毒、EBV DNA、Ureaplasma DNA, Pneumocystis jirovecli, HSV, hMPV RNA, HSV, 流行性感冒A,B、Mycoplasma pneumonia DNA
- 病毒核酸檢驗定量
  - viral load: HBV, HCV, CMV
- 細菌核酸檢驗
  - C. difficule toxin gene screen
  - 結核菌DNA,
- 抗藥基因檢測
  - Mycoplasma Pneumonia Macrolide resistance gene檢測

目前市面上的基因檢測服務

柯滄銘婦產科的遺傳檢驗實驗室(簡報做的時候他們網站還是舊的，現在已經改版，現代化許多)，算是很老牌的，可以看出很多醫院在還沒有分生組的時候，可能都是委託相關的實驗室幫忙，慧智基因和禾馨連鎖集團則是這五年台灣很厲害的基因檢測臨床服務模式，康百事生物資訊則是目前台灣還在努力專做基因分析臨床系統的公司。

基因定序其實就是指把序列轉換成資訊

基因定序是一個過程，將DNA（去氧核糖核酸）中的核苷酸序列轉換成可以解讀的生物信息。這一過程遵循“中心法則”（Central Dogma），即信息在生物體內的傳遞過程為：DNA→RNA→蛋白質。其中，DNA中的基因信息經過轉錄過程，生成了具有相應序列的mRNA（信使RNA），接著mRNA在細胞中的核糖體上進行轉譯，形成蛋白質。雖然這個法則目前發現沒有那麼單向，可以想像成都是雙向的。

在這個過程中，DNA序列中的三個連續核苷酸組成了一個密碼子（codon），每個密碼子對應一個特定的氨基酸。氨基酸是蛋白質的基本組成單位，它們按照特定的順序排列，形成蛋白質的一維結構。在翻譯過程中，tRNA（運載RNA）會根據mRNA上的密碼子搭配相應的氨基酸，並將它們連接在一起，最終形成具有特定功能的蛋白質。

2022年才有辦法第一次取得“完整”的人類基因參考序列

雖然大家都知道第一個人類基因組參考序列公布於2000年初，但對整個人類基因組的理解和探索仍有很大空間，比如以人類基因體參考序列來說，直到2022年，telomere-to-telomere（端粒至端粒計畫）項目才成功完成了第一個完整的人類基因組定序。這一突破的實現歸功於多個因素的共同作用，其中包括三代定序技術的成熟以及新的單倍體人類細胞株的建立等。

三代定序技術，也稱為長讀長技術，使得基因組研究人員能夠一次性讀取數千至數十萬個連續的核苷酸，這對於分析複雜的基因組區域具有顯著優勢。這種技術在人類基因組的連續定序中發揮了關鍵作用，尤其是在解決高度重複區域和結構變異等難題方面。

此外，新的單被人類細胞株的建立也為telomere-to-telomere項目的成功提供了重要支持。這些細胞株來自單倍個體，具有相對較低的基因變異，從而減少了定序過程中的錯誤和不確定性，且不用處理phasing的問題。此外，新建立的細胞株還為基因組學家提供了一個統一的、高質量的研究材料，使得定序結果具有更高的可靠性和可比性。

總之，telomere-to-telomere項目成功完成第一個完整的人類基因組定序，標誌著我們在基因組科學領域邁出了重要的一步。然而，人類對基因組的認知仍處於初期階段，未來仍需在多個方面深入研究，以期揭示更多關於生命奧秘的信息。

到底人類有多少個基因呢？

從這邊最新研究可以看到，人類基因組中大約包含2萬個蛋白質編碼基因。這些基因負責編碼蛋白質，這些蛋白質在細胞和生物體的各種生命活動中發揮作用。值得一提的是，基因僅佔人類基因組的約1-2％，而大部分基因組序列是非編碼區域。這些非編碼區域被認為在基因調控、染色體結構維持以及其他細胞功能中發揮作用。儘管非編碼區域的功能尚未完全揭示，但它們在基因組研究中被認為具有重要的生物學意義，所以這邊研究裡面其實基因不止2萬，其實是六萬個基因，因為這邊包含非編碼區域的基因，可以知道數量遠遠超過蛋白質編碼基因，可見我們還有多少是不知道的。

基因變異的種類和命名

基因變異是指基因組序列中的變化，以前可能會用突變這個詞，通常會帶有一點負面，但現在反而會把變異和他對個體的影響分開，這些變化可能影響基因的功能、蛋白質結構和生物體的表型。基因變異有多種類型，常見的有單核苷酸多態性（SNP）、插入/缺失（InDels）和結構變異（SV）等。

單核苷酸多態性（SNP）：SNP是指基因組中單個核苷酸的替換。它是最常見的基因變異類型，通常每隔100至300個核苷酸便有一個SNP。SNP可以分為同義變異（不改變氨基酸）和非同義變異（改變氨基酸），其中非同義變異可能對蛋白質功能產生影響。
插入/缺失（InDels）：InDels是指基因組中一個或多個連續核苷酸的插入或缺失。InDels會導致序列的變化，可能影響基因的讀碼框（reading frame），從而對蛋白質的結構和功能產生影響。
結構變異（SV）：結構變異是指基因組中較大片段的變化，包括重複（duplications）、缺失（deletions）、倒位（inversions）和易位（translocations）等。結構變異通常影響較大的基因組區域，可能對基因的表達和功能產生重大影響。

基因變異的命名原則通常包括以下幾個要素：基因名稱、變異類型、變異位置以及變異後的核苷酸或氨基酸。例如，對於一個位於第100個核苷酸位置的SNP，原始核苷酸為A，變異後為G，則變異可表示為：基因名稱:c.100A>G。這種表示方式有助於清晰地描述基因變異的特徵，便於研究和交流。

通常怎麼判斷一個變異的生物影響力，其中一個關鍵是其所在的位置，所以就要稍微了解一下所謂的基因結構。

人類基因結構包含多種序列元件，這些元件各自具有不同的功能，共同參與基因的轉錄、翻譯以及調控等過程。以下是一些主要的基因結構元件及其特性：

啟動子（Promoter）：啟動子是位於基因上游的一段DNA序列，通常在轉錄起始點（TSS）的上游100-1000個核苷酸範圍內。啟動子的主要功能是招募RNA聚合酶，以便於基因的轉錄。啟動子序列通常包含各種核心啟動元件，如TATA盒和CAAT盒等。
內含子（Intron）：內含子是指基因中不編碼蛋白質的序列區域，它們位於外顯子之間。在轉錄過程中，內含子會被刪除，生成成熟的mRNA。儘管內含子不直接參與蛋白質的編碼，但它們在基因調控、轉錄和可變剪接等方面具有重要功能。
外顯子（Exon）：外顯子是指基因中編碼蛋白質的序列區域。外顯子在轉錄過程中連接在一起，形成成熟的mRNA，然後進入翻譯過程以生成蛋白質。外顯子的數量和長度在不同基因間有很大差異。
增強子（Enhancer）：增強子是一段調控基因表達的DNA序列，通常位於基因上游、下游或內部。增強子通過與轉錄因子結合，影響啟動子的活性，從而調節基因的表達。增強子可以在幾千甚至幾十萬個核苷酸之外影響基因表達，並具有方向性和組織特異性。
沉默子（Silencer）：沉默子是一段調控基因表達的DNA序列，與增強子相反，沉默子通過與轉錄抑制因子結合，抑制基因的表達。
3’非編碼區（3′ UTR）和5’非編碼區（5′ UTR）：這些區域位於mRNA的3’端和
5’端，分別稱為3’非編碼區（3′ UTR）和5’非編碼區（5′ UTR）。它們不編碼蛋白質，但在mRNA的穩定性、轉錄後修飾和轉譯調控等方面具有重要作用。例如，一些microRNA通過與3′ UTR結合，導致mRNA的降解或轉譯抑制。
基因間區域（Intergenic regions）：這些區域位於相鄰基因之間的DNA序列，它們可能包含調控元件，如增強子、沉默子等，也可能具有未知的功能。基因間區域在基因組中佔據很大比例，研究這些區域對於理解基因表達調控和基因組組織具有重要意義。
重複序列（Repetitive sequences）：這些序列在基因組中重複出現，例如短串聯重複（Short Tandem Repeats, STRs）和轉座子（Transposons）等。重複序列在基因組中佔據很大比例，可能參與染色體結構的維持和基因表達調控等方面。
終止子（Terminator）：終止子是指位於基因下游的一段DNA序列，通常在轉錄終止點的下游。終止子的主要功能是指示RNA聚合酶在此處停止轉錄。

所以在不同位置的變異，其實多少就會造成不同功能上的影響。另外一個很重要的觀念則是基因變異跟實際造成的表型關係，其實很有多樣性的，常常就會用下面這張圖來代表。

2023 生物資訊學習資源彙整

2023 年 01 月 22 日1 則迴響

最近在Twitter上看到Ming Tommy Tang的分享關於生物資訊學習資源，想說就稍微紀錄一下，這邊也順便把之前寫過的一些關於資源類的文章匯集一起。

次世代定序資料分析學習資源(NGS analysis learning material)

2021 鐵人賽-AI, Data和生物資訊

這邊是原始的Twitter連結，我們把內容轉化為中文資訊，方便有興趣的人可以搜索得到。

10 courses/books to learn bioinformatics 🧵👇
— Ming "Tommy" Tang (@tangming2005) October 25, 2022

由哈佛大學生物統計教授Rafael Irizarry所建立的HarvardX Biomedical Data Science Open Online Training，內容涵蓋由淺入手，由理論到實務，由桌面端到雲端，主要是以R和Python為主。

Data Analysis for the Life Sciences Series
- Statistics and R
- Introduction to Linear Models and Matrix Algebra
- Statistical Interference and Modeling for High-throughput Experiments
- High-Dimensional Data Analysis
Genomics Data Analysis Series
- Introduction to Bioconductor: Annotation and Analysis of Genomes and Genomic assays
- High-performance computing for reproducible genomics with Bioconductor
- Case Studies in functional Genomics
- Using Python for Research

猶他大學的人類基因體學教授Aaron Quinlan，本身是bedtools作者，他的課程Applied Computational Genomics，有教學影片和相關簡報。這邊可以稍微看一下他的上課大綱：

Course Overview and Intro to Unix
Pattern searching in the human genome
Data frames and Importing Data
Intro to the tidyverse
DNA sequencing technologies
FastQ format and tools
Sequence mapping and alignment
Samtools and IGV
Poisson Processes in Biology
An introduction to awk and bioawk
Genetic Variation
SNP and INDEL discovery
Rates and patterns of human germline variation
VCF format, Hardy Weinberg Equilibrium, VCF toolkits
VCF annotation and interpretation
Genome Annotation and Resources
Genome Annotation Formats
Genome arithmetic with bedtools
Monte Carlo simulations and more on UNIX
Descriptive plots. The Central Limit Theorem

猴子演算法課程Bioinformatic Algorithms，是由Carnegie Mellon University教授Phillip Compeau(本身也創辦Rosalind，有點像是生物資訊領域的leetcode)和UCSD教授Pavel Pevzner所一起規劃的，其內容有影片、Coursera課程、電子書、互動式網頁等等不同的媒介來學習，主要針對生物問題展開，並且討論背後所衍生的演算法，算是很棒的學習素材，另一方面，也能理解生物資訊的重點不是只有程式，而是如何問問題和做假設：

Origin of replication
DNA patterns related to Molecular Clocks
Assemble Genomes
Sequence Antibiotics
Compare Biological Sequences
Fragile Regions in the Human Genome
Which Animal Gave Us SARS
How Did Yeast Become a Wine Maker
How Do we Locate Disease-Causing Mutation
Why Have Biologists still not developed an HIV Vaccine
Was T. rex Just a Big Chicken

Biostar創辦人Istvan Albert教授其所規劃的一系列電子書和課程，相對上面的資源來說，算是比較輕量等級的素材，內容定位在淺顯實用。

The Biostar Handbook
The Art of Bioinformatics Scripting
RNA-Seq by Example
Corona Virus Genome Analysis
Biostar Workflows

約翰霍普金斯的教授Michael Schatz 其所開設的Computational Genomics : Applied Compaative Genomics，在2018年的版本有提供簡報，最近兩年的則是有提供課程大綱和推薦閱讀。

Genomic Technologies
Whole Genome Assembly
Whole Genome Assembly and Alignment
The human genome and intro to long reads
Genomics in the Cloud
Read mapping
Variant Analysis
Structural Variant Analysis and Pangenomics
Genome Arithmetic and Plane Sweep
Machine Learning Primer
Functional Analysis
Human Evolution
Huan Genetic Disease
Cancer Genomics
Microbiome and Metagenomics
Genomic Futures

麻省理工學院計算生物學領域的教授Manolis Kellis則是開始蠻多機器學習/深度學習在生物醫學應用的主題，內容以啟發為主，細節則是依賴課後的閱讀，其涵蓋範圍相當廣泛。Github連結

	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(二）
	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(一）
	Kotlin 在可擴展標記語言XML是什麼？
	Cupid.K 在 2021 臨床次世代定序實務與應用概論
	kuoYH 在 2023 生物資訊學習資源彙整

	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(二）
	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(一）
	Kotlin 在可擴展標記語言XML是什麼？
	Cupid.K 在 2021 臨床次世代定序實務與應用概論
	kuoYH 在 2023 生物資訊學習資源彙整