Aritalab:Lecture/Programming/Unix
From Metabolomics.JP
< Aritalab:Lecture | Programming(Difference between revisions)
m |
|||
Line 1: | Line 1: | ||
{{Lecture/Header}} | {{Lecture/Header}} | ||
− | == | + | ==Windows・MacでUnix環境を使う== |
− | [ | + | Mac は Unix ライクなコンソールを備えていますが、Windowsは Ubuntu (LinuxOSの一種)をインストールする必要があります。 |
+ | まず以下のサイトのとおりに、Windows 上に WSL をインストールします。これで Ubuntu のコンソールを使えるようになります。 | ||
+ | |||
+ | - [https://docs.microsoft.com/ja-jp/windows/wsl/install] | ||
+ | |||
+ | 次に miniconda というパッケージマネジャーをインストールします。Minicondaは様々なソフトウェアを Linux 上に導入する conda パッケージの最小版になります。 | ||
+ | |||
+ | - [https://docs.conda.io/en/latest/miniconda.html] | ||
+ | |||
+ | Windows用の .exe ファイルをインストールすると windows powershell 用に環境が整ってしまいます。WSLで導入した Ubuntu から実行するには以下のようにします。 | ||
+ | <pre> | ||
+ | > curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh | ||
+ | ... | ||
+ | > bash Miniconda3-latest-Linux-x86_64.sh | ||
+ | ... | ||
+ | </pre> | ||
+ | これで miniconda が入ります。 | ||
==Unixコマンドの基本== | ==Unixコマンドの基本== | ||
コマンドのオプションや詳細は、"<tt>man コマンド名</tt>"や"<tt>コマンド名 --help</tt>"と打って調べましょう。 | コマンドのオプションや詳細は、"<tt>man コマンド名</tt>"や"<tt>コマンド名 --help</tt>"と打って調べましょう。 | ||
+ | <table> | ||
+ | <tr valign="top"><td> | ||
;ファイルシステム | ;ファイルシステム | ||
; ls : 指定されたディレクトリのファイル名を表示 | ; ls : 指定されたディレクトリのファイル名を表示 | ||
Line 16: | Line 34: | ||
; rmdir : ディレクトリを削除 (rmでも削除できる) | ; rmdir : ディレクトリを削除 (rmでも削除できる) | ||
; touch : 空のファイルを作成 | ; touch : 空のファイルを作成 | ||
− | + | </td><td> | |
; テキストファイル操作 | ; テキストファイル操作 | ||
; cat : 指定されたファイルを連結して標準出力に出す | ; cat : 指定されたファイルを連結して標準出力に出す | ||
Line 30: | Line 48: | ||
; head : ファイルの先頭10行を出力 | ; head : ファイルの先頭10行を出力 | ||
; tail : ファイルの末尾10行を出力 | ; tail : ファイルの末尾10行を出力 | ||
− | + | </td><td> | |
;ファイル圧縮 | ;ファイル圧縮 | ||
; gzip : ファイルを.gz拡張子のついた形に圧縮 | ; gzip : ファイルを.gz拡張子のついた形に圧縮 | ||
Line 43: | Line 61: | ||
; | : パイプ。左側のコマンドの標準出力を、右側のコマンドの標準入力につなぐ | ; | : パイプ。左側のコマンドの標準出力を、右側のコマンドの標準入力につなぐ | ||
; > : リダイレクト。左側のコマンドの標準出力をファイルに書き出す | ; > : リダイレクト。左側のコマンドの標準出力をファイルに書き出す | ||
+ | </td></tr> | ||
+ | </table> | ||
+ | == ゲノム解析に必要なツールとデータ== | ||
+ | conda を使って以下のように準備しておきます。 | ||
+ | <pre> | ||
+ | (base) $ conda install -y -c bioconda fastqc fastp megahit seqkit | ||
+ | ... | ||
+ | (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 | ||
+ | 6/DRR024501_1.fastq.bz2 | ||
+ | (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 | ||
+ | 6/DRR024501_2.fastq.bz2 | ||
+ | ... | ||
+ | (base) $ bunzip2 *.bz2 | ||
+ | ... | ||
+ | >seqkit stats *.fastq | ||
+ | (base) $ seqkit stats *.fastq | ||
+ | file format type num_seqs sum_len min_len avg_len max_len | ||
+ | DRR024501_1.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251 | ||
+ | DRR024501_2.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251 | ||
+ | </pre> |
Revision as of 15:54, 31 May 2022
Wiki Top | Up one level | レポートの書き方 | Arita Laboratory |
|
Windows・MacでUnix環境を使う
Mac は Unix ライクなコンソールを備えていますが、Windowsは Ubuntu (LinuxOSの一種)をインストールする必要があります。 まず以下のサイトのとおりに、Windows 上に WSL をインストールします。これで Ubuntu のコンソールを使えるようになります。
- [1]
次に miniconda というパッケージマネジャーをインストールします。Minicondaは様々なソフトウェアを Linux 上に導入する conda パッケージの最小版になります。
- [2]
Windows用の .exe ファイルをインストールすると windows powershell 用に環境が整ってしまいます。WSLで導入した Ubuntu から実行するには以下のようにします。
> curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh ... > bash Miniconda3-latest-Linux-x86_64.sh ...
これで miniconda が入ります。
Unixコマンドの基本
コマンドのオプションや詳細は、"man コマンド名"や"コマンド名 --help"と打って調べましょう。
|
|
|
ゲノム解析に必要なツールとデータ
conda を使って以下のように準備しておきます。
(base) $ conda install -y -c bioconda fastqc fastp megahit seqkit ... (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_1.fastq.bz2 (base) $ curl -O ftp://ftp.ddbj.nig.ac.jp//ddbj_database/dra/fastq/DRA002/DRA002643/DRX02218 6/DRR024501_2.fastq.bz2 ... (base) $ bunzip2 *.bz2 ... >seqkit stats *.fastq (base) $ seqkit stats *.fastq file format type num_seqs sum_len min_len avg_len max_len DRR024501_1.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251 DRR024501_2.fastq FASTQ DNA 2,971,310 745,798,810 251 251 251