知識ベース

短い散在核要素

短い散在核要素SINE )は、長さが約100から700塩基対である非自律的で非コーディングの転位要素(TE)です。それらは、真核生物のゲノム全体、多くの場合RNA中間体を介して自身を増幅するDNA要素であるレトロトランスポゾンのクラスです。

SINEの内部領域はtRNAに由来し、高度に保存されているため、SINEの構造と機能を維持するための正の圧力が示唆されます。 SINEは脊椎動物および無脊椎動物の多くの種に存在しますが、SINEは多くの場合系統に特異的であり、種間の多様な進化の有用なマーカーになります。 SINEシーケンスのコピー数の変動と突然変異により、種間のSINEの違いに基づいて系統を構築することができます。 SINEは、人間や他の真核生物の特定の種類の遺伝病にも関係しています。

本質的に、短い散在核要素は、真核生物の歴史のごく初期に進化した遺伝的寄生虫であり、生物内でタンパク質機械を利用するとともに、同様に寄生性のゲノム要素から機械を選択する。これらの要素は単純であるため、真核生物のゲノム内で(レトロトランスポジションを介して)持続および増幅することができます。ゲノムに遍在するようになったこれらの「寄生虫」は、以下で説明するように、生物にとって非常に有害な場合があります。しかし、真核生物は、短い散在核要素を異なるシグナル伝達経路、代謝経路、調節経路に統合することができ、遺伝的多様性の大きな源になりました。それらは、Sines and Gene-Regulationで説明されているように、遺伝子発現の調節とRNA遺伝子の作成に特に重要な役割を果たすようです。この規制は、クロマチンの再編成とゲノム構造の規制にまで及びます。さらに、真核生物の間の異なる系統、突然変異、および活動は、短い点在核要素を系統解析における信じられないほど有用なツールにします。

分類と構造

SINEは長い末端反復配列(LTR)を含まないため、非LTRレトロトランスポゾンとして分類されます。脊椎動物と無脊椎動物に共通する3つのタイプのSINEがあります:CORE-SINE、V-SINE、およびAmnSINE。 SINEには、RNAポリメラーゼIIIの内部プロモーターとして機能するAおよびBボックスを持つtRNA由来のセグメントを含む50〜500塩基対の内部領域があります。

内部構造

SINEの特徴はさまざまなモジュールであり、基本的にはシーケンスのセクションです。 SINEは、頭、体、尾を持つことができますが、必ずしも持っている必要はありません。頭部は、短い散在核要素の5 '末端にあり、リボソームRNAやtRNAなどのRNAポリメラーゼIIIによって合成されたRNAから進化的に派生しています。 5 'ヘッドは、SINEがどの内因性エレメントから派生し、その転写機構を寄生的に利用できるかを示しています。例えば、Alu sineの5 'は、豊富なリボ核タンパク質であるSRPのRNA要素をコードするRNA Polymerase IIIによって転写される配列である7SL RNAに由来します。 SINEの本体は未知の起源を持っていますが、多くの場合、対応するLINEと多くの相同性を共有しているため、SINEはLINE(特定の配列モチーフを認識する)によってコードされるエンドヌクレアーゼを寄生的に共存させることができます。最後に、SINEの3 'テールは、さまざまな長さの短い単純な繰り返しで構成されています。これらの単純な繰り返しは、2つ(またはそれ以上)の短い散在核要素が結合して二量体SINEを形成できる場所です。頭部と尾部だけでなく、短い点在する核要素は単純なSINEと呼ばれますが、体も持つ、または2つ以上のSINEの組み合わせである短い点在する核要素は複雑なSINEです。

転写

短い散在核要素は、リボソームRNAとtRNA、リボソームアセンブリとmRNA翻訳に不可欠な2種類のRNAを転写することが知られているRNAポリメラーゼIIIによって転写されます。 tRNAや多くの小核RNAのようなSINEは内部プロモーターを持っているため、ほとんどのタンパク質コード遺伝子とは異なる方法で転写されます。言い換えれば、短い散在核要素は、転写された領域自体の中に重要なプロモーター要素を持っています。 RNAポリメラーゼIIIによって転写されますが、SINEおよび内部プロモーターを持つ他の遺伝子は、上流のプロモーターを持つ遺伝子とは異なる転写機構と転写因子を動員します。

遺伝子発現への影響

染色体構造の変化は、主に遺伝子の転写機構へのアクセス可能性に影響を及ぼすことにより、遺伝子発現に影響を与えます。染色体には、ゲノムを組織化する非常に複雑で階層的なシステムがあります。ヒストン、メチル基、アセチル基、およびさまざまなタンパク質とRNAを含む組織のこのシステムにより、染色体内の異なるドメインがポリメラーゼ、転写因子、およびその他の関連タンパク質にさまざまな程度でアクセスできるようになります。さらに、染色体の特定の領域の形状と密度は、さまざまなタンパク質と要素によって促進される相互作用を通じて、染色体上の隣接する(または遠くの領域でも)形状と密度に影響を与える可能性があります。したがって、クロマチン構造と関連し、それに寄与することが知られている短い散在核要素などの非コードRNAは、遺伝子発現の調節に大きな役割を果たすことができます。たとえば、Ash1タンパク質をHox遺伝子セット内の調節エレメントに誘導することにより、長い非コードRNAがUbxの発現を開始するのに役立つことが知られています。 Ash1は、Ubxの発現を増加させるような方法でクロマチン構造を変更します。同様に、ゲノム構造を改変することにより、短い散在核要素を遺伝子調節に関与させることができます。

実際、ウスマノバ他。 2008年は、短距離に散在する核要素がクロマチンの再配列と構造の直接的なシグナルとして機能することを示唆しています。この論文は、マウスおよびヒト染色体におけるSINEのグローバルな分布を調べ、この分布が遺伝子およびCpGモチーフのゲノム分布に非常に類似していることを決定しました。遺伝子へのSINEの分布は、他の非コーディング遺伝子要素の分布よりもかなり類似しており、長く散在する核要素の分布とは大幅に異なっていました。これは、SINEの分布がLINEを介したレトロトランスポジションによって引き起こされた単なる事故ではなく、SINEが遺伝子調節に役割を果たしていることを示唆しています。さらに、SINEにはYY1ポリコームタンパク質のモチーフが含まれていることがよくあります。 YY1は亜鉛フィンガー蛋白質であり、発生とシグナル伝達に不可欠なさまざまな遺伝子の転写抑制因子として機能します。ポリコームタンパク質YY1は、ヒストン脱アセチル化酵素とヒストンアセチルトランスフェラーゼの活性を媒介して、クロマチンの再編成を促進すると考えられています。これはしばしばヘテロクロマチンの形成を促進するためです(遺伝子サイレンシング状態)。したがって、分析は、クロマチン再編成による遺伝子セットのポリコーム依存性サイレンシングにおいて、短い散在核要素が「シグナルブースター」として機能できることを示唆しています。本質的に、密に詰まっておらず一般的に転写機構にアクセスしやすいユークロマチンと、密に詰まって一般に転写機構にアクセスできないヘテロクロマチンとの違いをもたらすのは、多くのタイプの相互作用の累積効果です。 SINEは、このプロセスで進化的な役割を果たしているようです。

クロマチン構造に直接影響を与えることに加えて、SINEが遺伝子発現を潜在的に調節できる多くの方法があります。たとえば、長い非コーディングRNAは転写抑制因子および活性化因子と直接相互作用し、それらの機能を減衰または修正することができます。このタイプの調節はさまざまな方法で発生します。RNA転写産物は、共調節因子として転写因子に直接結合できます。また、RNAは、転写因子と結合する共調節因子の能力を調節および変更できます。例えば、特定の長い非コードRNAであるEvf-2は、神経系の発達と組織化に重要な特定のホメオボックス転写因子の共活性化因子として機能することが知られています。さらに、RNA転写産物は、転写またはローディングプロセス中にRNAポリメラーゼと相互作用または会合することにより、転写複合体の機能を妨害する可能性があります。さらに、SINEのような非コードRNAは、遺伝子をコードするDNA二本鎖と直接結合または相互作用するため、その転写を防ぐことができます。

また、多くの非コーディングRNAはタンパク質コーディング遺伝子の近くに、しばしば逆方向に分布しています。これは、ウスマノバらに見られるように、短い点在核要素に特に当てはまります。遺伝子セットに隣接または重複するこれらの非コードRNAは、転写因子と機械を動員して局所遺伝子の転写を増加または抑制するメカニズムを提供します。 SINEの特定の例は、YY1ポリコーム転写リプレッサーを潜在的にリクルートします。あるいは、転写複合体が近くの遺伝子の転写を妨害または防止できるため、局所遺伝子発現を抑制および調節できるメカニズムも提供します。この現象が多能性細胞の遺伝子調節に特に見られることを示唆する研究があります。

結論として、SINEなどの非コードRNAは、さまざまなレベルでさまざまな方法で遺伝子発現に影響を与えることができます。短い散在核要素は、真核生物ゲノム全体で遺伝子発現を微調整できる複雑な調節ネットワークに深く統合されていると考えられています。

伝播と規制

短い散在核要素によってコードされたRNAは、タンパク質産物をコードしませんが、それでも逆転写され、ゲノムの代替領域に挿入されます。このため、LINEは実際にタンパク質産物をコードしているため、短い点在核要素は長い点在核要素(LINE)と共進化していると考えられています。 SINEは、2つのリーディングフレームに含まれるLINEによってコードされるタンパク質を選択したと考えられています。オープンリーディングフレーム1(ORF 1)は、RNAに結合し、シャペロンとして作用してLINEタンパク質-RNA複合体構造を促進および維持するタンパク質をコードします。オープンリーディングフレーム2(ORF 2)は、エンドヌクレアーゼと逆転写酵素の両方の活性を持つタンパク質をコードします。これにより、タンパク質のエンドヌクレアーゼドメインによって認識される配列モチーフに基づいて、LINE mRNAをDNAに逆転写し、ゲノムに組み込むことができます。

LINE-1(L1)は、生殖細胞系および初期発生中に最も頻繁に転写およびレトロトランスポーズされます。その結果、SINEはこれらの期間中、ほとんどのゲノムを動き回ります。 SINE転写は、初期発生後に体細胞の転写因子によってダウンレギュレートされますが、ストレスは通常はサイレントSINEのアップレギュレーションを引き起こす可能性があります。 SINEは、ウイルスベクターを介した水平転送により、個人または種間で転送できます。

SINEはLINESと配列相同性を共有することが知られており、LINE機構がSINE転写産物を逆転写および統合できる基盤を提供します。あるいは、一部のSINEは、ゲノムに統合するはるかに複雑なシステムを使用すると考えられています。このシステムは、ランダムな二本鎖DNA切断の使用を伴います(挿入サイトを作成する、関連する長く散在する核要素によってコードされるエンドヌクレアーゼではなく)。これらのDNA切断は、逆転写酵素のプライミングに利用され、最終的にSINE転写産物をゲノムに戻します。それにもかかわらず、SINEは他のDNA要素によってコードされる酵素に依存しており、したがって、自律レトロトランスポゾンとして知られるLINEの機構に依存するため、非自律レトロトランスポゾンとして知られています。

短い点在核要素が長い点在核要素のレトロトランスポゾン機構を利用するために進化したという理論は、異なる種の分類群におけるLINEとSINEの存在と分布を調べる研究によって支持されています。たとえば、げっ歯類および霊長類のLINEおよびSINEは、挿入部位モチーフで非常に強い相同性を示します。このような証拠は、SINE転写産物の統合をLINEでコードされたタンパク質製品と一緒に採用できる提案されたメカニズムの基礎です。これは、主にそれぞれL1とB1の20を超えるげっ歯類種プロファイルLINEとSINEの詳細な分析によって具体的に示されています。これらは、他の哺乳類とともにげっ歯類で高頻度に見られるLINEおよびSINEのファミリーです。この研究では、LINEおよびSINEアクティビティのコンテキスト内で系統発生の明確さを提供しようとしました。

この研究は、L1 LINE絶滅の最初の事例と思われる分類群の候補に到達しました。 L1 LINE活性を持たない種でB1 SINE活性が発生したことを示唆する証拠はないことが予想されました。また、この研究は、B1の短い点在する核要素のサイレンシングが、実際にはL1の長い点在する核要素の消滅の前に起こることを示唆しました。これは、B1 SINEがアクティブなL1 LINEを含まない属と最も密接に関連する属で沈黙しているという事実によるものです(ただし、B1 SINEサイレンシングの属にはアクティブなL1 LINEが含まれています)。同様に、アクティブなL1の長い点在核要素を含むが、B1の短い点在核要素を含まない別の属が見つかりました。アクティブなL1 LINEを持たない属にアクティブなB1 SINEが存在する反対のシナリオは見つかりませんでした。この結果は予想されており、SINEが進化し、LINEによってコードされるRNA結合タンパク質、エンドヌクレアーゼ、および逆転写酵素を共最適化するという理論を強く支持しています。長く散在する核要素タンパク質産物を積極的に転写および翻訳しない分類群では、SINEには、ゲノム内でレトロトランスポーズするための理論的基盤がありません。 Rinehartらで得られた結果。したがって、SINEレトロトランスポジションの現在のモデルを非常に支持しています。

SINE転置の効果

コード領域の上流にSINEを挿入すると、エクソンシャッフリングまたは遺伝子の調節領域の変更が生じる場合があります。遺伝子のコード配列へのSINEの挿入は有害な影響を与える可能性があり、無秩序な転位は遺伝病を引き起こす可能性があります。 SINEと他の活性核要素の転位と組換えは、種分化の間の系統間の遺伝的多様性の主要な貢献の1つであると考えられています。

一般的なサイン

短い点在核要素は、真核生物のゲノムに寄生起源を持っていると考えられています。これらのSINEは、進化のタイムスケールで信じられないほど多くの回数を変化させ、複製してきたため、多くの異なる系統を形成しています。それらの初期の進化的起源は、それらを多くの真核生物系統に遍在するようにした。

約300ヌクレオチドの短い散在核要素であるAlu要素は、ヒト全体で最も一般的なSINEであり、ゲノム全体で1,000,000を超えるコピーを持ち、これは全ゲノムの10%以上です。これは他の種の間では珍しいことではありません。 Alu要素のコピー数の違いを使用して、霊長類種の系統発生を区別し、構築することができます。イヌは、他の遺伝子または対立遺伝子レベルの変異ではなく、ゲノム全体のSINEC_Cfリピートの豊富さが主に異なります。これらの犬固有のSINEは、スプライスアクセプターサイトをコードし、各種でエクソンまたはイントロンとして表示される配列を変更する場合があります。

病気

SINEに関連する50を超えるヒト疾患があります。エクソンの近くまたは内部に挿入すると、SINEは不適切なスプライシングを引き起こしたり、コーディング領域になったり、リーディングフレームを変更したりして、人間や他の動物の病気の表現型を引き起こすことがあります。ヒトゲノムへのAlu要素の挿入は、乳がん、大腸がん、白血病、血友病、デント病、嚢胞性線維症、神経線維腫症などに関連しています。

マイクロRNA

細胞内の遺伝子調節における短い散在核要素の役割は、複数の研究によって支持されています。そのような研究の1つでは、特定のSINEファミリーとマイクロRNA(ゼブラフィッシュ)との相関関係を調べました。調査されている特定のSINEファミリーは、Anamnia V-SINEです。短い散在核要素のこのファミリーは、多くの遺伝子の3 '末端の非翻訳領域にしばしば見られ、脊椎動物のゲノムに存在します。この研究では、 ダニオレリオゼブラフィッシュのアナムニアV-SINEのゲノム分布と活性を調べた計算分析を行いました。さらに、これらのV-SINEが新規マイクロRNA遺伝子座を生成する可能性を分析しました。 V-SINEを保有すると予測された遺伝子は、(ゲノムの他の領域と比較して)著しく高いハイブリダイゼーションE値を持つマイクロRNAの標的となることがわかりました。ハイブリダイゼーションのE値が高い遺伝子は、代謝およびシグナル伝達経路に特に関与する遺伝子でした。遺伝子の推定V-SINEシーケンスモチーフにハイブリダイズする強力な能力があると特定されたほぼすべてのmiRNAは、規制の役割を持つことが特定されています(哺乳類)。短い散在核要素と異なる調節マイクロRNAとの相関関係を確立するこれらの結果は、V-SINEが代謝、増殖、分化に関連するさまざまな信号と刺激に対する応答を減衰させる上で重要な役割を果たすことを強く示唆しています。調節遺伝子発現ネットワークにおける短い散在核要素レトロトランスポゾンの役割の妥当性と範囲を確立するために、他の多くの研究を実施しなければなりません。結論として、SINEがmiRNA遺伝子座を生成する役割とメカニズムについてはあまり知られていませんが、SINEは「RNA遺伝子」の作成において重要な進化的役割を果たしていると一般に理解されています。 &偽遺伝子。

そのような証拠は、短い散在核要素がマイクロRNA遺伝子座生成の進化的源であると示唆しているため、2つの潜在的な関係だけでなく、マイクロRNAがRNA分解およびより広く遺伝子発現を調節するメカニズムをさらに議論することが重要です。マイクロRNAは、一般に22ヌクレオチド長の非コードRNAです。この非タンパク質コーディングオリゴヌクレオチドは、それ自体が真核生物のほとんどのmRNAおよびsnRNAの転写にも関与するRNAポリメラーゼIIによって通常転写されるより長い核DNA配列によってコードされています。しかし、いくつかの研究は、上流の短い散在核要素を有するいくつかのマイクロRNAが、mRNA翻訳に不可欠な2つの転写産物であるリボソームRNAおよびtRNAに広く関与しているRNAポリメラーゼIIIによって転写されることを示唆しています。これは、短い散在核要素がmicroRNAを含む遺伝子調節ネットワークと相互作用または媒介する代替メカニズムを提供します。

miRNAをコードする領域は、隣接するタンパク質をコードする遺伝子に対してアンチセンスであることが多い独立したRNA遺伝子であるか、タンパク質をコードする遺伝子のイントロン内に見られます。 microRNAとタンパク質をコードする遺伝子の共局在は、microRNAが遺伝子発現を調節する機構的な基盤を提供します。さらに、スカルパト等。 (上記のように)配列分析により短い散在核要素(SINE)を保有すると予測される遺伝子が、他の遺伝子よりも有意に大きいmicroRNAによって標的化され、ハイブリダイズしたことが明らかになりました。これは、複雑な遺伝子調節ネットワークで役割を果たすように進化したRNA遺伝子(マイクロRNAなど)を形成するために寄生SINEが選択され利用される進化経路を提供します。

マイクロRNAは、相補的な塩基対形成によりヘアピンループ構造を形成することができる一般的に約80ヌクレオチドのより長いRNA鎖の一部として転写される。これらの構造は、Droshaタンパク質をリクルートして関連付ける核タンパク質DiGeorge Syndrome Critical Region 8(DGCR8)によって核内で認識および処理されます。この複合体は、細胞質に輸送されるpre-microRNAからヘアピン構造の一部を切断します。 pre-miRNAは、タンパク質DICERによって二本鎖22ヌクレオチドに処理されます。その後、鎖の1つが多タンパク質RNA誘導サイレンシング複合体(RISC)に組み込まれます。これらのタンパク質の中には、複合体が相互作用して標的mRNAの翻訳を抑制する能力に重要なアルゴノートファミリーのタンパク質があります。

microRNAがmRNAの翻訳や分解を含む遺伝子発現を調節するさまざまな方法を理解することは、遺伝子調節およびmicroRNA遺伝子座の生成におけるSINEの潜在的な進化的役割を理解する鍵となります。これは、SINEと特定の疾患との関係を理解し​​始めるために、規制ネットワークにおけるSINEの直接的な役割(SINEで長い非コーディングRNAとして議論されている)に加えて重要です。複数の研究により、SINE活性の増加が特定の遺伝子発現プロファイルおよび特定の遺伝子の転写後調節と相関していることが示唆されています。実際、ピーターソンら。 2013年には、高いSINE RNA発現が、複数の形態の癌、すなわち乳癌に関係する腫瘍抑制因子であるBRCA1の転写後ダウンレギュレーションと相関していることが実証されました。さらに、研究により、SINEの転写動員と特定の癌および低酸素などの状態との間に強い相関関係が確立されています。これは、SINE活動によって引き起こされるゲノムの不安定性と、より直接的な下流の影響による可能性があります。 SINEは他の無数の病気にも関係しています。本質的に、短い点在する核要素は、無数の調節、代謝、およびシグナル伝達経路に深く統合されており、したがって疾患を引き起こすのに避けられない役割を果たしています。これらのゲノム寄生虫についてはまだ多くのことが知られていますが、それらが真核生物内で重要な役割を果たすことは明らかです。

SINEおよび偽遺伝子

しかし、SINEの活動には、ポジティブなものであれネガティブなものであれ、重要な役割を果たさないと思われる遺伝的痕跡があり、偽遺伝子としてゲノムに現れます。ただし、SINEはRNA偽遺伝子と間違われるべきではありません。一般に、タンパク質コーディング遺伝子の処理されたmRNAが逆転写され、ゲノムに組み込まれると、偽遺伝子が生成されます(RNA偽遺伝子は逆転写されたRNA遺伝子です)。偽遺伝子は、イントロンや転写とプロセッシングを可能にするさまざまな調節要素を含む進化の文脈とは無関係に、処理されたRNAから派生するため、一般に機能しません。これらの偽遺伝子は、非機能的ではあるが、プロモーター、CpGアイランド、および転写を可能にする他の機能を保持している場合があります。したがって、それらは転写可能であり、遺伝子発現の調節に役割を持っている可能性があります(SINEや他の非コード要素など)。したがって、偽遺伝子は、転写された機能性RNAに由来するという点でSINEとは異なりますが、SINEは、RNA遺伝子の転写機構を選択することによりレトロトランスポーズするDNA要素です。しかし、短い散在核要素などのレトロトランスポーザブル要素は、ゲノム内の別の領域で自分自身をコピーできるだけでなく、ランダム遺伝子でも同様にコピーできることを示唆する研究があります。したがって、SINEは、それ自体が規制ネットワークに関与していることが知られている偽遺伝子の生成に重要な役割を果たすことができます。これはおそらく、SINEが遺伝子調節に影響を与え、貢献できる別の手段です。