生物学
シングルセルシーケンシング
シングルセルシーケンシングは、最適化された次世代シーケンシング(NGS)テクノロジーを使用して個々のセルのシーケンス情報を調べ、細胞の違いをより高解像度で、その微小環境のコンテキストで個々のセルの機能をよりよく理解します。個々の細胞のDNAを配列決定することにより、例えば癌などの小さな細胞集団によって運ばれる突然変異に関する情報を得ることができますが、個々の細胞によって発現されるRNAの配列を決定することにより、例えば開発中のさまざまな細胞タイプの存在と挙動を知ることができます
バックグラウンド
典型的なヒト細胞は、約2 x 33億塩基対のDNAと6億塩基のmRNAで構成されています。通常、サンガーシーケンスやイルミナシーケンスなどの従来の方法を使用したDNAまたはRNAのシーケンスでは、数百万個の細胞の混合物が使用されます。単一細胞からのDNAおよびRNAのディープシーケンスを使用することにより、細胞機能を広範囲に調査できます。典型的なNGS実験のように、単一細胞シーケンシングのプロトコルには一般に次のステップが含まれます:単一細胞の単離、核酸抽出および増幅、シーケンシングライブラリー調製、シーケンシングおよびバイオインフォマティクスデータ分析。大量の細胞からのシーケンスと比較して、単一細胞のシーケンスを実行することはより困難です。単一セルからの出発物質が最小限であるため、分解、サンプルの損失、およびコンタミネーションにより、シーケンシングデータの品質に顕著な影響を及ぼします。さらに、使用される核酸の量がピコグラムレベルであるため、単一細胞シーケンシングのサンプル調製中に頻繁に大量の増幅が必要となり、不均一なカバレッジ、ノイズ、およびシーケンシングデータの不正確な定量化をもたらします。
最近の技術的な改善により、単一セルシーケンスは、一見アクセスできない問題に対処するための有望なツールとなっています。たとえば、異質なサンプル、まれな細胞タイプ、細胞系統の関係、体組織のモザイク、培養できない微生物の分析、および疾患の進化はすべて、単一細胞シーケンシングを通じて解明できます。ネイチャー・パブリッシング・グループにより、2013年の方法として単一細胞シーケンシングが選択されました。
単一細胞ゲノム(DNA)シーケンス
単一細胞DNAゲノムシーケンスには、単一細胞の分離、全ゲノム増幅(WGA)の実行、シーケンスライブラリの構築、そして次世代シーケンサー(Illumina、Ion Torrentなど)を使用したDNAのシーケンスが含まれます。この方法で構築されたゲノムは、通常、単一の増幅されたゲノムまたはSAGと呼ばれます。未培養微生物からゲノムデータを取得するために、微生物叢研究で使用できます。さらに、微生物と癌の高スループットセルソーティングと統合できます。単一細胞ゲノムシーケンスに使用される一般的な方法の1つは、複数置換増幅です。これにより、微生物遺伝学、生態学、感染症などのさまざまな分野の研究が可能になります。さらに、微生物から得られたデータは、将来の培養プロセスを確立する可能性があります。単一細胞ゲノムシーケンスで使用できるゲノムアセンブリツールには、SPADE、IDBA-UD、Cortex、HyDAなどがあります。
方法
複数置換増幅(MDA)は広く使用されている手法であり、細菌からDNAのフェムトグラムを増幅して、シーケンシングに使用します。 MDA反応に必要な試薬には、ランダムプライマーとバクテリオファージphi29のDNAポリメラーゼが含まれます。 30度の等温反応では、付属の試薬でDNAが増幅されます。ポリメラーゼが新しい鎖を製造すると、鎖置換反応が起こり、各テンプレートDNAから複数のコピーが合成されます。同時に、先行して延長されたストランドが移動します。 MDA製品の長さは約12 kbで、最大約100 kbの範囲であるため、DNAシーケンスに使用できます。 2017年に、W29-Xと呼ばれるこの手法の大幅な改善が導入され、phi29ポリメラーゼの熱安定性変異体を利用して、個々の細胞、特にG + C含有量の高い細胞からのゲノム回復が向上しました。他の方法にはMALBACが含まれます。
制限事項
個々の細胞ゲノムのMDAは、非常に不均一なゲノムカバレッジ、つまり、テンプレートのさまざまな領域の相対的な過剰表示と過少表示をもたらし、一部の配列の損失につながります。このプロセスには2つの要素があります。a)ランダム領域の確率的過増幅および過小増幅。およびb)高%GC領域に対する体系的なバイアス。確率的コンポーネントは、蛍光in situハイブリダイゼーション(FISH)および/または事後配列確認を使用することにより、同じ細胞型からの単一細胞MDA反応をプールすることで対処できます。高%GC領域に対するMDAのバイアスは、WGA-Xと呼ばれるプロセスなどで熱安定性ポリメラーゼを使用することで対処できます。
ヒトゲノムの遺伝的変異の大きな部分である一塩基多型(SNP)、およびコピー数変異(CNV)は、単一細胞の配列決定に問題を引き起こし、単一細胞から抽出されたDNAの量が限られています。 DNAの量が少ないため、カバレッジが低くエラーが発生しやすいため、増幅後でもDNAの正確な分析には問題があります。 MDAを使用すると、平均ゲノムカバレッジは80%未満になり、シーケンスリードでカバーされないSNPはオプトアウトされます。さらに、MDAは高い割合の対立遺伝子ドロップアウトを示し、ヘテロ接合サンプルから対立遺伝子を検出しません。現在、さまざまなSNPアルゴリズムが使用されていますが、単一セルシーケンスに固有のものはありません。また、CNVを使用したMDAでは、実際のCNVを隠す偽のCNVを識別するという問題が生じます。これを解決するために、偽のCNVからパターンを生成できる場合、アルゴリズムはこのノイズを検出および根絶して、真のバリアントを生成できます。
用途
マイクロバイオームは、ほとんどの環境で大部分の微生物を培養することが難しいため、単一細胞ゲノミクスの主なターゲットの1つです。単一細胞ゲノミクスは、培養せずに微生物ゲノム配列を取得する強力な方法です。このアプローチは、微生物生態学、進化、公衆衛生、およびバイオテクノロジーの可能性に関連する幅広い質問に対処するために、海洋、土壌、地下、生物、およびその他のタイプのマイクロバイオームに広く適用されています。
がんの配列決定は、scDNAseqの新たなアプリケーションでもあります。新鮮または凍結腫瘍は、全ゲノムDNASアプローチを使用して、SCNA、SNV、および再編成に関して非常によく分析および分類できます。がんscDNAseqは、バルク腫瘍の従来の集団レベルのアプローチでは共-腫瘍の単一細胞内でのこれらの突然変異の発生パターン。そのような重複は、経路活性化と腫瘍細胞耐性の冗長性を提供する可能性があります。
単一細胞DNAメチロームシーケンス
単一細胞DNAメチロームシーケンスは、DNAメチル化を定量化します。これは単一細胞ゲノムの配列決定に似ていますが、配列決定の前に重亜硫酸塩処理が追加されています。フォームには、全ゲノムの亜硫酸水素塩シーケンス、および縮小表示亜硫酸水素塩シーケンスが含まれます
トランスポザーゼにアクセス可能なクロマチンの単一細胞アッセイ(scATAC-seq)
単一細胞の転置可能なクロマチン配列は、ゲノム全体のクロマチンアクセシビリティをマッピングします。トランスポザーゼは、クロマチンの開いた領域に配列決定アダプターを直接挿入し、それらの領域を増幅して配列決定できるようにします。
単一細胞RNAシーケンス(scRNA-seq)
マイクロアレイや標準バルクRNA-seq分析などの標準的な方法では、大規模な細胞集団からのRNAの発現を分析します。混合細胞集団では、これらの測定により、これらの集団内の個々の細胞間の重大な違いが不明瞭になる場合があります。
単一細胞RNAシーケンス(scRNA-seq)は、個々の細胞の発現プロファイルを提供します。各細胞が発現するすべてのRNAに関する完全な情報を入手することはできませんが、利用可能な材料が少量であるため、遺伝子発現のパターンは遺伝子クラスタリング分析により特定できます。これにより、これまでに見られなかった可能性のある細胞集団内のまれな細胞タイプの存在を明らかにすることができます。たとえば、嚢胞性線維症膜貫通コンダクタンスレギュレーターを発現する肺イオノサイトと呼ばれる肺のまれな特殊な細胞は、2018年に肺気道上皮でscRNA-Seqを実行する2つのグループによって特定されました。
実験手順
現在のscRNA-seqプロトコルには、次の手順が含まれます:単一細胞とRNAの分離、逆転写(RT)、増幅、ライブラリー生成、およびシーケンス。初期の方法では、個々の細胞を別々のウェルに分離しました。より最近の方法は、逆転写反応が起こり、RNAをcDNAに変換するマイクロ流体デバイス内の個々の細胞を液滴でカプセル化します。各液滴には、単一の細胞に由来するcDNAを一意にラベル付けするDNA「バーコード」が付いています。逆転写が完了すると、多くの細胞のcDNAをシーケンス用に混合できます。特定のセルからの転写物は、一意のバーコードによって識別されます。
scRNA-Seqの課題には、細胞内のmRNAの初期の相対存在量を保存し、まれな転写物を特定することが含まれます。 RT反応の効率によって、最終的にシーケンサーによって分析される細胞のRNA集団の量が決まるため、逆転写ステップが重要です。使用される逆転写酵素の処理能力とプライミング戦略は、完全長cDNAの生成と、遺伝子の3 'または5'末端に偏ったライブラリーの生成に影響を与える可能性があります。
現在、増幅ステップでは、PCRまたはin vitro転写(IVT)のいずれかがcDNAの増幅に使用されています。 PCRベースの方法の利点の1つは、完全長cDNAを生成できることです。ただし、特定の配列(GCコンテンツやスナップバック構造など)で異なるPCR効率も指数関数的に増幅され、カバレッジが不均一なライブラリが生成される場合があります。一方、IVTによって生成されたライブラリーはPCR誘導の配列バイアスを回避できますが、特定の配列は非効率的に転写され、配列の脱落や不完全な配列の生成を引き起こす可能性があります。いくつかのscRNA-seqプロトコルが公開されています:Tang et al。、STRT、SMART-seq、CEL-seq、RAGE-seq、Quartz-seq。およびC1-CAGE。これらのプロトコルは、逆転写、cDNA合成および増幅の戦略、および配列固有のバーコード(UMI)に対応する可能性、またはプールされたサンプルを処理する能力の点で異なります。
2017年には、REAP-seqおよびCITE-seqとして知られるオリゴヌクレオチド標識抗体を介して単一細胞のmRNAおよびタンパク質の発現を同時に測定する2つのアプローチが導入されました。
用途
scRNA-Seqは、開発、神経学、腫瘍学、自己免疫疾患、感染症などの生物学分野で広く使用されています。
scRNA-Seqは、線虫Caenorhabditis elegansや再生プラナリアSchmidtea mediterraneaを含む胚と生物の発達に関するかなりの洞察を提供しました。この方法でマッピングされた最初の脊椎動物は、ゼブラフィッシュとアフリカツメガエルでした。いずれの場合も、胚の複数の段階が研究されており、発生プロセス全体を細胞ごとにマッピングすることができました。科学はこれらの進歩を2018年のブレークスルー・オブ・ザ・イヤーとして認識しました。
考慮事項
単一細胞の分離
全ゲノム増幅およびシーケンシングの前に個々の細胞を分離するいくつかの方法があります。蛍光活性化細胞選別(FACS)は、広く使用されているアプローチです。個々の細胞は、マイクロマニピュレーションによって、たとえば連続希釈によって、またはパッチピペットまたはナノチューブを使用して単一細胞を収集することによっても収集できます。マイクロマニピュレーションの利点は、簡単で低コストですが、手間がかかり、顕微鏡下での細胞タイプの誤認の影響を受けやすいことです。レーザーキャプチャマイクロダイセクション(LCM)は、単一細胞の収集にも使用できます。 LCMは組織内のサンプリングされた細胞の空間的位置に関する知識を保持しますが、隣接する細胞から材料を収集せずに単一の細胞全体をキャプチャすることは困難です。単一細胞分離のハイスループット法には、マイクロフルイディクスも含まれます。 FACSとマイクロフルイディクスはどちらも正確で、自動で、偏りのないサンプルを分離できます。ただし、どちらの方法でも、最初に細胞を微小環境から切り離す必要があり、それによりRNA発現解析の転写プロファイルに摂動が生じます。
分析する細胞の数
scRNA-Seq一般的に、典型的なバルク細胞RNAシーケンス(RNAシーケンス)実験では、1000万リードが生成され、100万リードあたりkbあたり50リード(RPKM)のしきい値を超える遺伝子が発現していると見なされます。 1kbの長さの遺伝子の場合、これはポアソン分布の仮定の下で500回の読み取りと4%の最小変動係数(CV)に対応します。 200,000 mRNAを含む典型的な哺乳動物細胞の場合、この最小CV値を達成するには、少なくとも50個の単一細胞の配列データをプールする必要があります。ただし、実験で導入された逆転写およびその他のノイズの効率のため、正確な発現解析と細胞タイプの同定にはより多くの細胞が必要です。