類似発現プロファイルを検索する | ||||
Title | 類似発現プロファイルを検索する | |||
Caption | 入手した発現プロファイルデータに類似するものがGEOやArrayExpressといったデータベースにないか調べる方法を説明します。 | |||
Detail | 『類似発現プロファイルを検索する』 入手した発現プロファイルデータを問い合わせとして、GEOやArrayExpressといった発現プロファイルデータベースから類似発現プロファイルデータを検索する方法を説明します。 【類似データの検索】 核酸配列であれアミノ酸配列であれ、データを新しく入手した際には、GenBank等の配列データベースに対してホモロジー検索をかけることが当り前のように行われています。この目的は様々ですが、既知データを調べることで、新規データの素性や特徴を速やかに得られる可能性があるためです。このことは配列データに限ったことではありません。近年、マイクロアレイ技術の躍進により発現解析が盛んになりましたが、同じことが発現プロファイルデータにも当てはまります。 【発現プロファイルデータ比較の問題】 核酸配列やアミノ酸配列は、原則、前者であれば4種類、後者であれば20種類の化学物質で構成されています。それゆえ、どんな計測装置を用いても、得られる配列決定の結果は同じでなくてはなりません。当然ながら、配列決定結果同士は比較可能ということになります。このような比較に基づくDB検索技術は確立の域に達しており、BLASTやBLATといったツールが公開されています。 一方、発現プロファイルデータは、転写産物のコピー数という動的に変化する量を計測した結果です。現状においては、名目上同じ実験材料に対しても、同じ結果を得ることは難しい仕事です。ここには、実験材料の調整が本質的に難しいことに加え、計測装置、計測者、計測場所、計測日時の違いといった要因が関与します。また、遺伝子の識別に用いられるIDは計測機器メーカーの間で統一されていませんので、計測装置が異なればデータの構成要素である発現レベル同士を直ちに対応付けることができません。これらが原因となって、発現プロファイルデータ同士の比較を困難なものとしています。 ![]() 【発現プロファイルデータベース検索ツール】 発現プロファイルデータベースの最大手であるGEOには、類似発現プロファイルデータを検索する機能が備え付けられていますが、これは既にGEOに納められている発現プロファイルデータでなければ問い合わせにすることはできません。つまり、計測したての発現プロファイルデータを問い合わせにして検索を実行することはできません。これを行うには、CellMontageが利用可能です。このツールには、遺伝子IDの統一、正規化不要、ノイズに強い類似尺度の利用といった工夫が施されており、異なる計測装置によって得られた発現プロファイルデータ同士を比較することができます。そして、GEOおよびArrayExpressのデータを取り込んでいるので、広範囲に及ぶ検索が可能です。 【WWWサイトの利用】 以下に、CellMontageのWWWサイトを利用して類似発現プロファイルを検索する手順を説明します。
![]() 使用できるツール:
|