知識ベース

計算ゲノミクス

計算ゲノミクス (計算遺伝学と呼ばれることも多い)は、DNAおよびRNA配列と他の「ポストゲノム」データ(実験データなど)を含むゲノム配列および関連データから生物学を解読するための計算および統計分析の使用を指しますゲノムDNAマイクロアレイなど、ゲノムシーケンスを必要とする技術で得られます)。これらは、遺伝子の機能を理解するための計算的および統計的アプローチおよび統計的関連分析と組み合わせて、計算および統計遺伝学/ゲノミクスとも呼ばれます。そのため、計算ゲノミクスはバイオインフォマティクスと計算生物学のサブセットと見なされる場合がありますが、種のDNAが分子レベルでその生物学を制御する方法の原則を理解するために(個々の遺伝子ではなく)全ゲノムの使用に焦点を当てており、超えて。現在の膨大な生物学的データセットの豊富さにより、計算研究は生物学的発見にとって最も重要な手段の1つとなっています。

歴史

計算ゲノミクスのルーツは、バイオインフォマティクスのルーツと共有されています。 1960年代、National Biomedical Research FoundationのMargaret Dayhoffおよびその他は、進化研究のために相同タンパク質配列のデータベースを組み立てました。彼らの研究は、特定のタンパク質が基礎となるアミノ酸配列に基づいて別のタンパク質に変化するために必要な進化的変化を決定する系統樹を開発しました。これにより、あるタンパク質が別のタンパク質に関連している可能性を評価するスコアリングマトリックスが作成されました。

1980年代から、ゲノム配列のデータベースが記録され始めましたが、これは遺伝子情報のデータベースの検索と比較という形で新しい課題を提示しました。 GoogleやWikipediaなどのWebサイトで使用されるテキスト検索アルゴリズムとは異なり、遺伝的類似性のセクションを検索するには、単純に同一ではなく類似した文字列を見つける必要があります。これにより、ニードルマン・ブンシュアルゴリズムが開発されました。これは、Dayhoffによる以前の研究から得られたスコアリングマトリックスを使用して、アミノ酸配列のセットを相互に比較するための動的プログラミングアルゴリズムです。その後、BLASTアルゴリズムは、遺伝子配列データベースの高速で最適化された検索を実行するために開発されました。 BLASTとその派生物は、おそらくこの目的で最も広く使用されているアルゴリズムです。

「計算ゲノミクス」というフレーズの出現は、1990年代半ばから後半にかけて完全な配列決定されたゲノムが入手可能になったことと一致しています。計算ゲノムに関する年次会議の最初の会議は、1998年にゲノム研究所(TIGR)の科学者によって開催され、この専門分野のフォーラムを提供し、この分野の科学をより一般的なゲノミクスまたは計算生物学の分野と区別しています。科学用語でこの用語が最初に使用されたのは、MEDLINEの要約によると、Nucleic Acids Researchではわずか1年前でした。 2006年に最後の計算ゲノミクス会議が開催され、ヘリコバクターピロリと胃潰瘍との関連を共同発見したノーベル賞受賞者バリーマーシャルによる基調講演が行われました。 2014年現在、この分野の主要な会議には、分子生物学のためのインテリジェントシステム(ISMB)および計算分子生物学の研究(RECOMB)が含まれています。

コンピューター支援数学の開発(MathematicaやMatlabなどの製品を使用)は、エンジニア、数学者、コンピューター科学者がこの分野での運用を開始するのを助け、全ゲノム比較から遺伝子に至るまで、ケーススタディとデモンストレーションの公開コレクションが成長しています発現分析。これにより、システムと制御の概念、情報理論、文字列分析、データマイニングなど、さまざまなアイデアの導入が増えました。過去数年間に作成された複数のコースで両方のトピックに堪能な学生が形成され始める一方で、計算アプローチは研究と教育の標準トピックになり、今後もそうであると予想されます。

計算ゲノミクス研究の生物学への貢献

生物学への計算ゲノミクス研究の貢献は次のとおりです。

  • セルラー信号ネットワークの提案
  • ゲノム進化のメカニズムの提案
  • いくつかの哺乳類および脊椎動物種との比較ゲノミクス技術を使用して、すべてのヒト遺伝子の正確な位置を予測します
  • 初期胚発生に関連する保存されたゲノム領域を予測する
  • 繰り返される配列モチーフと組織特異的な遺伝子発現の間の潜在的なリンクを発見する
  • 異常に急速な進化を遂げたゲノムの領域を測定する