ゲノム配列を増幅するためのプライマーを設計したり、
エクソン・イントロン構造を予測したりする際、ゲノム配列からその対象となる領域を切り出す必要性に迫られる場合があります。
【手作業にかかる労力とミスの混入】長かろうと短かろうと、ゲノム配列から人の目で興味対象領域を見つけ出すことは、非常に面倒な作業です。それ故に、ミスが混入する可能性をなくすことは難しいでしょう。ヒトゲノムの1番染色体では、247Mbaseに及びますので、これを人手で扱うのはもはや不可能です。
【各種ツールの利用】そこで、ゲノム配列から興味対象領域を切り出すツールを利用します。いろいろありますので目的に応じて使い分けるといいでしょう。
- NCBI Entrez Nucleotide
Genbankにおけるゲノム配列のアクセッション番号やIDが分かっていて、興味対象領域の位置が分かっているのであれば、その興味対象領域を切り出すことができます。 - Ensembl BioMart
遺伝子のアクセッション番号やシンボルが分かっていれば、その遺伝子領域を切り出すことができます。ただし、Ensemblが取り扱う生物種にしか利用できません。 - fastacmdもしくはnibFrag
BLASTパッケージに同梱されているfastacmd、BLATパッケージに同梱されているnibFragを用いれば、自分のコンピュータに保存されている配列データから興味対象領域を切り出すことができます。自分の研究室でシークエンシングしたゲノム配列を取り扱いたい場合はこの方法がよいでしょう。
【NCBI Entrez Nucleotide】以下に、NCBI Entrez Nucleotideの利用方法を説明します。
- NCBIのWEBサイトにアクセスします。ページの上部に検索ツールがあるので、対象とするゲノム配列のアセクッション番号やIDを入力して"Go"ボタンをクリックします。データベースから"Nucleotide"を選択しておくと、早く目的の配列データにたどり着くことができます。
- 検索結果一覧ページから、その配列に関する詳細情報を提供するページへジャンプします。
- 配列に関する詳細情報を提供するページにおいて、"Display"の"FASTA"を選択し、"Range"に興味対象領域の開始点と終了点を入力して"Refresh"ボタンをクリックします。すると、その領域の配列だけが表示されます。この逆鎖が必要であれば、"Reverse complemented strand"のチェックボックスにチェックを付けておきます。
【Ensembl BioMart】以下に、Ensembl BioMartの利用方法を説明します。
- EnsemblのWEBサイトにアクセスし、BioMartのページへジャンプします。そこで、利用するデータベース(2008/10/28時点では、Ensembl v50、SNP v50、Vega32が利用可能)及び生物種を選択します。
- 生物種まで選択すると、フィルターページ、アトリビュートページにアクセス可能となります。デフォルトでは全ての遺伝子が対象となりますので、特定の遺伝子についてのみ配列データが必要である場合は、フィルターページにアクセスして絞り込み条件を設定します。絞り込み条件としては、染色体番号や、染色体上の特定領域、マーカーに挟み込まれる領域、遺伝子のIDや機能情報を設定可能です。
- アトリビュートページでは、取り扱われる遺伝子について、具体的に何を取得するかを設定します。まず、"Features"、"Homologs"、"Structures"、"Sequences"及び"SNPs"という選択肢があります。ここから"Sequences"を選択すると配列の切り出しに関する選択肢が表示されます。遺伝子コード領域(エクソン+イントロン)、5'UTR、3'UTR、flanking配列、エクソン領域の配列を繋げたもの、CDSなどを切り出すことができます。
- "Results"というボタンをクリックすると、配列の切り出しが実行されます。
【fastacmdまたはnibFrag】以下に、fastacmdとnibFragの利用方法を説明します。これらの配布元は異なりますが、基本的にユーザに求められる作業に変わりはありません。ここでは、処理の大まかな流れのみを示します。具体的な操作についてはこれらのマニュアルをご覧ください。
- BLASTパッケージ(もしくはBLATパッケージ)をインストールします。
- FASTAフォーマットで配列データをファイルに保存します。
- この先、Unix系OSの場合はターミナルを、Windows系の場合はコマンドプロンプトを使います。BLASTパッケージに納められているformatdbを用いてBLAST専用フォーマットへと変換します。この際、"-o"オプションを使用します。(BLATパッケージの場合はfaToNibもしくはfaToTwobitを用いてBLAT専用フォーマットへ変換します。)
- fastacmd(BLATの場合はnibFrag)を用いて興味対象領域を切り出します。最低限、興味対象領域の開始位置、終了位置、側鎖を設定する必要があります。プログラムの挙動をコントロールするために色々なオプションが用意されていますので試してみるとよいでしょう。
使用できるツール: