BioArchLinux は生物学者のための Arch Linux コミュニティで、バイオインフォマティクスソフトウェアの Arch Linux リポジトリを含んでいます。このリポジトリは貢献しやすく、ユーザーフレンドリーで、Arch Linux やその派生ディストリビューション、Windows、Docker にバイオインフォマティクスソフトウェアを素早くインストールするのに役立ちます。
なぜBioArchLinuxプロジェクト?
例えば、現在の科学用ディストリビューションのほとんどは、Bio-LinuxやPoseidon LinuxのようなUbuntuベースか、Scientific LinuxのようなCentOSやRHELベースです。しかし結局、これらのディストリビューションは徐々に活動を停止しつつあり、Scientific Linuxはどうしようもないことを示す います。
Scientific Linuxの経験は、パッケージが商用企業に依存したり、商用企業が支配しているディストリビューションにパッケージ化されると、開発の方向性がわからなくなり、当初の目標や計画が実現できなくなることを示しています。当初、Scientific Linuxは、有償のLinuxディストリビューションRHELに依存し、その後、営利企業の無償コミュニティ・ディストリビューションCentOSに依存し、その後、Red Hatは、ローリング・ディストリビューションCentOS Streamをサポートするために、CentOS 8のライフサイクルを急遽終了しました。Stream。Scientific Linuxは、そもそも間違った選択でした。
Bio-LinuxをBio-Linuxの観点から見ると、Bio-Linuxは基本的に様々なソフトウェアパッケージをUbuntuにパッケージしたディストリビューションです。ソフトウェアが1~2年の間にアップデートされるサイクルは避けられないのですが、Bio-Linuxはそれを考慮していないため、古いバージョンを使ってデータを解析しているケースがあり、明らかに研究に資するものではありません。さらに、Bio-Linux 8はUbuntu 14.04 LTSをベースにしていた2014年以降リリースされておらず、現在はUbuntu 22.04 LTSがリリースされています。 Bio-Linuxの お知らせ 古いだけでなく冗長で、必要なパッケージがすべて揃っているわけではありません。必要なパッケージが全部入っているわけでもなく、必要のないパッケージがたくさん入っていて、これが私のPCの負担を増やしているのは間違いありません。
Poseidon Linuxにも同様の問題があります。リリースの遅れとシステムの再インストールの必要性は特に不便です。ソフトウェアを最新の状態にするためには、ISOをあまり頻繁にリリースしなくても、すぐに更新できるパッケージのリポジトリを運営する方が良いでしょう。
また、Linux の開発に関わる必要があるのであれば、サードパーティリポジトリや公式リポジトリに簡単にアクセスでき、営利企業とは関係のないディストリビューションを探す必要があります。ここでは Arch Linux を選びます。
同時に、AUR への貢献者だけのグループにはしたくありません。私の考えでは、このグループは RedHat ディストリビューションの SIG のようなものかもしれません。AUR はスクリプトを保存するだけで、コンパイル済みのパッケージではありません。これにはいくつかの問題があります。まず、AUR は公式リポジトリにあるパッケージと衝突することはありませんが、これはバイオインフォマティクスのターゲットとなるユーザーグループにとっては問題です。例えば、私は picard を探していますが、コミュニティリポジトリにある picard はすでに同じ名前の別のソフトウェアで、コミュニティリポジトリにしかなく、私は使いません。そのため、AUR を探すために多くの手間をかけなければなりません。AUR のもう一つの不便な点は、パッケージのソースが常にブロックされているわけではないということです。 以前、Arch のディストリビューションを妹に熱心にプッシュしたことがあり、妹はかなり便利だと感じていましたが、AUR からソフトウェアをダウンロードしようとすると、インターネットによって彼女の想像力が制限されてしまいました。しかし、Image ソースを持つリポジトリが形成されれば、この問題を心配する必要はありませんし、インターネットが遮断された国の人々が必要なソフトウェアにアクセスするために遅いインターネットスピードや法的リスクを我慢する必要もありません。
BioArchLinuxの使い方
まず、BioArchLinux 自体の特性によってユーザーがどこで使えるかが決まります。 BioArchLinux は生物学者のための Arch Linux コミュニティで、生物学ソフトウェアの Arch Linux リポジトリ、編集可能な wiki、Matrix チャットチャンネルがあります。
Arch Linux で BioArchLinux を使う
BioArchLinux は Arch Linux とその派生ディストリビューションに対応しており、ソフトウェアのインストールは簡単です。必要なパッケージをインストールするのに必要なのは、いくつかの簡単なコマンドだけです。
# echo -e "[bioarchlinux] Server = https://..rg/\$ch" >> /etc/pacman.conf# pacman-key --recv-keys B1F96021DB62254D# pacman-key --finger B1F96021DB62254D# pacman-key --lsign-key B1F96021DB62254D# pacman -Syy# pacman -S pkg_name
もちろん、他のソフトウェアリポジトリとは異なり、BioArchLinuxリポジトリでは、可能な限り各パッケージの説明にDOIを提供しています。 これにより、ユーザーは各パッケージの用途や方法について簡単に知ることができ、出版物を準備する際に適切な引用を素早く特定することができます。
$ pacman -Ss doi_number$ pacman -Qi pkg_name
WSLでBioArchLinuxを使う
さらに、BioArchLinuxはWSLとDocker Imageも提供しているため、WindowsやmacOSユーザーは、バイオインフォマティクスソフトウェアを実行するLinux環境が必要な場合、簡単にBioArchLinuxを使用することができます。
Windowsユーザーの場合、DockerがWindows上でWSLに依存しているため、WSLを使用することをお勧めします。それを解凍し、wslがインストールされたBioArch.exeファイルをダブルクリックしてインストールを開始します:
wsl -d BioArch
使用する前に、WSL の初期化など、いくつかの初期化タスクを実行する必要があります。
# echo 'Server = https://.../ux/$/os/$ch' > /etc/pacman.d/mirrorlist# echo 'Server = https://.../ux/$ch' > /etc/pacman.d/mirrorlist.bio# pacman -Syu
この時点で、WSLを使用する準備が整いました。
dockerでBioArchLinuxを使う
Dockerの使い方はWSLの使い方と似ていますが、Dockerをインストールした後、以下のコマンドで入ることができます。入った後も、WSLの初期化コマンドを使ってDockerコンテナを初期化する必要があります。
# docker pull bioarchlinux/bioarchlinux# docker run -it --privileged --name container_name --restart=always bioarchlinux/bioarchlinux /bin/bash
BioArchLinuxはどのように動作しますか?
BioArchLinux リポジトリは、いくつかのオープンソースソフトウェアによって管理されています。 主なツールはlilacと呼ばれるpythonアプリケーションです。
最も基本的なステップは Arch Linux と lilac.yaml の標準に従ってスクリプトを書くことです。PKGBUILD シェルスクリプトと YAML ファイルを書いて Git リポジトリのフォルダに置いてください。
nvchecker は lilac.yaml を読み込んでアップストリームサイトからの情報を取得し、最新バージョンをチェックすることができます。nvchecker がアップストリームサイトからパッケージのバージョンを見つけられない場合、問題を報告するために管理者にメールを送信します。
nvchecker からの情報は lilac に送られ、lilac はパッケージをアップグレードする必要があるかどうかを判断します。パッケージのアップグレードが必要な場合、lilac は Arch Linux のパッケージングツール devtools にパッケージを送ります。
devtools は PKGBUILD シェルスクリプトの依存関係リストだけでビルドできるクリーンな環境をパッケージに提供します。これは使用中に依存関係が失われるのを防ぎます。パッケージのビルドが失敗した場合、警告メールがパッケージメンテナに 自動的に送られます。パッケージのビルドが成功した場合、archrepo2 は Arch Linux パッケージを特定のパスに置き、新しいデータベースファイルを生成し、全く新しいパッケージリポジトリを作成します。lilac.yaml に AUR をメンテナンスするディレクティブが含まれていれば、パッケージのアップデートは AUR にもバウンスされます。
ビルドプロセス全体はログファイルとして記録され、Rustアプリケーション bioarchlinux-packages 使用して読み込んだり、ログサイトに表示したりすることができます。
このウィキはMediaWikiをベースにしています。バイオインフォマティクスソフトウェアの使い方や、バイオインフォマティクスの概念や用語について、誰でも自由に投稿することができます。
BioArchLinux Outlook
BioArchLinuxには、上記のような良い点もありますが、実は欠点もたくさんあります。
リポジトリから始めると、わずか1年で約420万パッケージ、AURパッケージの4.7%がメンテナンスされていますが、Debian Medやbiocondaと比べると量的に大きな隔たりがあり、より多くのメンテナが参加し、パッケージの質を常に向上させることが急務です。
あとは、リポジトリの利用者の拡大とコミュニティのメンテナンスの強化です。WSLとDokcerはあるのですが、仮想マシンで動かすのが好きな人もいて、でもISOファイルは提供できないし、メンテナンス要員も必要。また、専属のウィキ管理者もおらず、ユーザー登録に制限がないため、一時期スパムが殺到していました。
例えば、Arch Linux のようなパッケージ検索インターフェイスはありません。それに加えて、非 root ユーザーでリポジトリを使う方法はまだ大きな問題です。
もっと多くの人がコミュニティーに参加し、一緒にクレイジーで素晴らしいことをするのは大歓迎です。
謝辞
国際計算生物学会MRes進化生物学会員
この記事は Japan Open Submission Schemeに投稿されたもので、 CC-BY-SAプロトコルの 下で公開されています。





