PBS(Portable Batch System)系統效調細節筆記：使用叢集係統來做百萬級抗原變異點的預測

之前有測試幾種加速運算的方法，用python裡的線程搭配外掛程式來躲避GIL的效能限制等，但不同種類的架構能應付的問題（高I/O, 高運算…），這邊嘗試使用手邊另一個叢集系統來做計算，利用PBS中分發任務的能力來調用底下的電腦群們來做運算，過程也是一堆的大坑，主要的框架是用shell script寫成的，因為手邊這個叢集電腦python是舊版的，然後還得確定下面的電腦們每個環境都要乾淨，所以就先試者用最簡單的方式來加速計算，最後效調的結果可以在一周內分析完3425328個蛋白序列，雖然還是不夠快。（不確定是否是最佳做法，可能偏“土炮”）

整個過程有幾個重點：
1. 使用shell指令來處理大檔案的技巧
2. PBS系統的理解

第一部分在shell script的撰寫上，相對於高階語言如python，就少掉很多如線城池、共享變數等等用來暫時存放運算資料的方法，這時候就會需要比較複雜的代碼來實現想要的邏輯。技術上可以先把script用最小單位來撰寫，接者在測試成功後，慢慢合成一個大的，因為當牽涉越多層的呼叫使用，需多未知的東西狀態出現，尤其是想要用&的方式來加速（因為目前這叢集系統無法安裝linux parell指令）。

這邊可以堆間使用awk和sed的功能來做不雜一點的計算和資料搬移（他們很輕且通常很快），尤其搭配awk裡面的條件語法和函數，計算速度可以因此稍微提生一點，且能用“一行”來解決在高階語法可能要很多行代碼才搞定的字串處理問題。

第二部分關於PBS語法和功能的理解，雖然每個叢集系統多少會不同（就跟每個linux管理員管理的想法不同一樣，會對自己的系統加入不同的觀念），但指令的說明是差不多的。

三大關於PBS的指令分別為：pbsnodes, qstat, qsub

pbsnodes: 用來看目前叢集系統中，各個節點的資源和任務條波狀況

qstat:用來看目前任務的運行狀況和單個任務所使用的資源

qsub:提交任務到PBS系統上

還有意外發現使用parent-child的shell process中，當程式的架構互叫的方式可能會造成無法預期的意外，比如簡單的file descriptor的指定，在parent和child process中分開執行，且一對多的時候運行的邏輯很怪，這部份可能要更深入底層才會理解這部分的坑。

	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(二）
	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(一）
	Kotlin 在可擴展標記語言XML是什麼？
	Cupid.K 在 2021 臨床次世代定序實務與應用概論
	kuoYH 在 2023 生物資訊學習資源彙整

	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(二）
	臨床次世代定序NGS Workshop… 在使用國網中心超級電腦台灣衫建置定序分析流程(一）
	Kotlin 在可擴展標記語言XML是什麼？
	Cupid.K 在 2021 臨床次世代定序實務與應用概論
	kuoYH 在 2023 生物資訊學習資源彙整

分享此文：

發表留言 取消回覆

發表留言取消回覆