TrimmomaticでFASTQファイルを処理する(クオリティスコアで配列をトリムする)

次世代シーケンサー

Trimmomaticとは

Trimmomaticはイルミナ社のNGSデータ(FASTQファイル)を処理するためのツールです。アダプター配列の除去や、配列のクオリティスコアの低い部分の除去に使われることが多いです。詳しくはこちらのサイトをご覧ください。

Trimmomatic: A flexible read trimming tool for Illumina NGS data

Trimmomaticのダウンロード

以下のコマンドを実行すると、Trimmomaticをダウンロードすることができます。

Trimmomaticで配列をトリムする

まず、Trimmomaticをダウンロードしたディレクトリに移動します。

今回は、1.fastqというFASTQファイルを処理して2.fastqというFASTQファイルに出力することを考えます。

  • SE:シングルリード(ペアエンドリードの場合はPE)
  • threads:CPUのスレッド数
  • phred33 または phred64を指定する
  • trimlog log.txt :実行ログを保存するファイル
  • 1.fastq:読み込むFASTQファイル
  • 2.fastq:出力用のFASTQファイル
  • TRAILING:30: リードの後尾からクオリティスコアが 30 未満の塩基をトリムする。

コードを実行すると以下のような表示が出てきます。

その他のオプション

上のコマンドでは TRAILING をオプションとして指定し、任意のクオリティスコア未満の部分を配列末尾から削除しました。その他にも、様々なオプションがあるので、目的に合わせて併用してください。

  • ILLUMINACLIP: 配列からアダプターや他のイルミナに特異的な配列を取り除く
  • SLIDINGWINDOW: ウィンドウをずらしながらトリミングを行う。指定した値よりもウインドウの中に含まれる配列のクオリティスコアが低い場合取り除かれる。 「SLIDINGWINDOW: ウインドウサイズ:平均クオリティ」の形式で記載する。
  • LEADING: 指定した値よりもクオリティスコアが低い場合は配列の先頭から除去する。
  • TRAILING: 指定した値よりもクオリティスコアが低い場合は配列の末尾から除去する。
  • CROP: 指定した長さの配列を先頭から残す。
  • HEADCROP: 指定した長さの配列を先頭から除去する。
  • MINLEN: 指定した長さよりも短い配列を除去する。
  • TOPHRED33: クオリティスコアをPhred-33に変える
  • TOPHRED64: クオリティスコアをPhred-64に変える
タイトルとURLをコピーしました