Category  ||   Tool  |   How-to  |   Review  ||   Keyword
類似発現プロファイルを検索する
Title 類似発現プロファイルを検索する
Caption 入手した発現プロファイルデータに類似するものがGEOやArrayExpressといったデータベースにないか調べる方法を説明します。
Detail 『類似発現プロファイルを検索する』
入手した発現プロファイルデータを問い合わせとして、GEOやArrayExpressといった発現プロファイルデータベースから類似発現プロファイルデータを検索する方法を説明します。

【類似データの検索】
核酸配列であれアミノ酸配列であれ、データを新しく入手した際には、GenBank等の配列データベースに対してホモロジー検索をかけることが当り前のように行われています。この目的は様々ですが、既知データを調べることで、新規データの素性や特徴を速やかに得られる可能性があるためです。このことは配列データに限ったことではありません。近年、マイクロアレイ技術の躍進により発現解析が盛んになりましたが、同じことが発現プロファイルデータにも当てはまります。

【発現プロファイルデータ比較の問題】
核酸配列やアミノ酸配列は、原則、前者であれば4種類、後者であれば20種類の化学物質で構成されています。それゆえ、どんな計測装置を用いても、得られる配列決定の結果は同じでなくてはなりません。当然ながら、配列決定結果同士は比較可能ということになります。このような比較に基づくDB検索技術は確立の域に達しており、BLASTBLATといったツールが公開されています。
一方、発現プロファイルデータは、転写産物のコピー数という動的に変化する量を計測した結果です。現状においては、名目上同じ実験材料に対しても、同じ結果を得ることは難しい仕事です。ここには、実験材料の調整が本質的に難しいことに加え、計測装置、計測者、計測場所、計測日時の違いといった要因が関与します。また、遺伝子の識別に用いられるIDは計測機器メーカーの間で統一されていませんので、計測装置が異なればデータの構成要素である発現レベル同士を直ちに対応付けることができません。これらが原因となって、発現プロファイルデータ同士の比較を困難なものとしています。


【発現プロファイルデータベース検索ツール】
発現プロファイルデータベースの最大手であるGEOには、類似発現プロファイルデータを検索する機能が備え付けられていますが、これは既にGEOに納められている発現プロファイルデータでなければ問い合わせにすることはできません。つまり、計測したての発現プロファイルデータを問い合わせにして検索を実行することはできません。これを行うには、CellMontageが利用可能です。このツールには、遺伝子IDの統一、正規化不要、ノイズに強い類似尺度の利用といった工夫が施されており、異なる計測装置によって得られた発現プロファイルデータ同士を比較することができます。そして、GEOおよびArrayExpressのデータを取り込んでいるので、広範囲に及ぶ検索が可能です。

【WWWサイトの利用】
以下に、CellMontageのWWWサイトを利用して類似発現プロファイルを検索する手順を説明します。
  1. 手持ちの発現プロファイルデータをCMフォーマットに変換します。CMフォーマットについてはCellMontageのWEBサイトをご覧ください。遺伝子IDはUniGene IDかRefseqのアクセッション番号である必要があります。これらと異なる遺伝子IDが用いられている場合は、計測機器メーカーが公開する情報に当たれば対応が取れるかもしれません。
  2. CellMontageのWEBサイトにアクセスし、入力画面へジャンプします。まず、用いられている遺伝子IDのタイプ(UniGene IDもしくはRefseqのアクセッション番号)と、検索対象とするデータベースを選択します。そして、問い合わせ配列をペースト、もしくはアップロード設定を行い、サブミットボタンをクリックします。
  3. 検索の結果、ヒットした発現プロファイルデータが一覧表示されます。これらのヒットは類似度の高い順にソートされています。
  4. 興味深いヒットがあれば、そのヒットに与えられているアイコンをクリックします。すると、そのヒットに関する詳細情報が表示されます。ここには、発現プロファイルデータ同士がどのように類似しているかが可視化されています。



使用できるツール:
発現プロファイルデータベースの検索 CellMontage
/マイクロアレイデータ解析/発現解析/データベース検索/も参照