- INDEX目次
目次【非表示】
- 1.NGS前処理とは?データ品質を決定づける最初のステップ
- 2.NGSサンプル調製の流れを4ステップで解説
- 2-1.ステップ1:解析の土台となる核酸(DNA/RNA)を抽出する
- 2-2.ステップ2:シークエンサーで読めるようにDNAを断片化する
- 2-3.ステップ3:目印となるアダプター配列を付加する
- 2-4.ステップ4:ライブラリを増幅し品質をチェックする
- 3.高品質なデータを取得するために!NGS前処理で押さえるべき3つのポイント
- 3-1.ポイント1:出発点となるサンプルの品質管理を徹底する
- 3-2.ポイント2:各工程で品質チェック(QC)を必ず実施する
- 3-3.ポイント3:信頼性の高いプロトコルと試薬を選択する
- 4.まとめ
次世代シーケンス(NGS)における前処理は、高品質なデータを取得するために非常に重要な工程です。このプロセスは、核酸(DNAやRNA)を抽出し、ngsシーケンスが可能な状態に調製する一連の作業を指します。
具体的には、サンプルから核酸を抽出し、その後にシーケンサーで読み取れるようにDNAを適切なサイズに断片化します。 次に、断片化されたDNAの両端にアダプターと呼ばれる特定の配列を付加し、最後にライブラリーを増幅して品質を確認します。 これらのステップを適切に行うことで、信頼性の高いngsシーケンスデータを取得し、その後の解析の精度を向上させることができます。
NGS前処理とは?データ品質を決定づける最初のステップ
次世代シーケンシング(NGS)における前処理とは、サンプルから得られたDNAやRNAを、シーケンサーで読み取り可能な状態に調整する一連の工程を指します。この前処理は、高品質なデータを得るために非常に重要な最初のステップであり、その後のマッピングや変異解析の精度に大きく影響します。具体的には、核酸の抽出・精製、断片化、アダプター配列の付加、ライブラリーの増幅と品質チェックなどが含まれます。前処理の工程で品質が低いデータが生成されると、正確な配列情報を得ることができず、一塩基変異(SNV)などの重要な遺伝子変異を見逃してしまう可能性もあります。そのため、各ステップで徹底した品質管理が不可欠です。
NGSサンプル調製の流れを4ステップで解説
次世代シーケンシング(NGS)におけるサンプル調製は、データ品質を左右する非常に重要な工程です。NGSのワークフローは主に4つのステップで構成されており、それぞれの手順を適切に進めることが高品質なシーケンスデータを得るために不可欠となります。具体的には、核酸抽出、ライブラリー調製、シーケンス、そしてデータ解析です。これらのステップを経て、シーケンサーで解析可能なデータが得られます。
ステップ1:解析の土台となる核酸(DNA/RNA)を抽出する
次世代シーケンス(NGS)の前処理における最初のステップは、解析の土台となるDNAまたはRNAといった核酸をサンプルから高純度かつ高収量で抽出することです。この工程の品質が、その後のシークエンシングやデータ解析の正確性に直結するため、非常に重要になります。具体的な抽出方法は、使用するサンプル(組織、細胞、血液など)や保存状態によって異なり、酵素、溶媒、界面活性剤などを用いて細胞を破壊し、核酸を分離します。
一般的に、DNA単離の伝統的な手法としてはフェノールベースの抽出法がありますが、操作が煩雑でフェノールによる汚染のリスクも伴います。その代替として、DNAに特異的に結合するスピンカラムや、クロロホルムベースの抽出、あるいは市販のキットに含まれる樹脂を利用した方法などがあり、これらは簡便かつ高純度の核酸を得るために有効です。
抽出された核酸は、その後のライブラリ調製工程に進む前に、濃度、純度、完全性(断片化の程度)の品質評価が必須です。特に、純度は吸光度比(A260/280やA260/230)で評価され、PCR阻害物質の混入がないか確認します。また、核酸の完全性は電気泳動やキャピラリー電気泳動システム(例:Bioanalyzer)で確認し、分解が進んでいないことを確認します。gc含有量も考慮に入れ、特定の配列に偏りがないかを評価することも重要です。これらの品質管理を徹底することで、NGS解析の成功率を高めることができます。
ステップ2:シークエンサーで読めるようにDNAを断片化する
NGSシーケンスにおいて、抽出したDNAをシークエンサーで読み取れる適切な長さに断片化する工程は非常に重要です。ほとんどの次世代シーケンス(NGS)プラットフォームでは、均一なサイズのDNA断片を用いて解析が行われます。この断片化により、特定の長さ分布を持つDNA断片の「ライブラリー」が生成されます。
DNAの断片化には主に機械的方法と酵素的方法の2種類があります。機械的方法であるシャーリングは、ランダムにDNAを切断するため、ゲノム全体から様々な長さの重複する断片を得ることができ、de novoアセンブリ(新規ゲノム配列の構築)に適しています。一方、酵素的方法は比較的迅速かつ低コストで実施できますが、特定の部位を優先的に切断する「偏り」が生じる可能性があるため、de novoアセンブリには不向きな場合があります。
断片化されたDNAは、一本鎖の「粘着末端」を持っていることがあり、次のステップであるアダプター連結に備えて、これらの末端を修復し平滑末端にする必要があります。この断片化の工程を通じて、次世代シーケンサーで効率的に読み取ることができる、適切なサイズのDNAライブラリーが構築されるのです。
ステップ3:目印となるアダプター配列を付加する
NGSの前処理におけるステップ3では、断片化したDNAの両端にアダプター配列と呼ばれる短いDNA配列を付加します。この工程は、次世代シーケンス解析を行う上で非常に重要です。アダプター配列は、シーケンサー上でのDNA断片の固定や、シーケンスの読み取り開始点となるプライマー結合部位、さらには複数のサンプルを同時に解析する際にサンプルを識別するためのバーコード(インデックス配列)の役割を担っています。
アダプター配列を付加する方法は主に「ライゲーション法」と「タグメンテーション法」の2種類です。ライゲーション法では、DNAリガーゼという酵素を用いてDNA断片とアダプター配列を連結させます。この際、効率的な結合を促すために、DNA断片の末端を平滑化し、さらにA末端付加を行うことが一般的です。A末端付加により、アダプターのTオーバーハングとの相補的な結合が可能になります。
一方、タグメンテーション法は、転移酵素(Tn5トランスポゼース)を利用してDNAの断片化と同時にアダプター配列の付加を行う方法です。この方法は、ライゲーション法と比較して工程が少なく、短時間でライブラリー調製を完了できる利点があります。
どちらの方法を選択するかにかかわらず、このステップで高品質なアダプター付加を行うことは、その後のシーケンスの精度やデータ解析の成功に直結します。アダプター配列が適切に付加されていない場合、シーケンスエラーやリードの品質低下を招く可能性があるため、注意が必要です。
ステップ4:ライブラリを増幅し品質をチェックする
アダプター配列が付加されたDNA断片は「ライブラリ」と呼ばれ、シークエンサーで読み取れる状態にするために増幅と品質チェックが必要です。特にDNA量が少ないサンプルでは、PCR(ポリメラーゼ連鎖反応)を用いた増幅が不可欠となります。PCR増幅では、高忠実度DNAポリメラーゼを使用して、ライブラリ断片を迅速かつ正確に増幅することが重要です。この工程でライブラリに変異やバイアスが生じると、シーケンスデータの品質に悪影響を及ぼす可能性があります。例えば、GC含量が高い領域は増幅されにくいというGCバイアスが生じることが報告されており、これを最小限に抑えるための高正確性ポリメラーゼの選択が求められます。
ライブラリ増幅後には、その品質を評価するためのチェックが必須です。この品質チェック(QC)は、ライブラリ調製、シーケンスなどNGSワークフローのあらゆる段階で実施されるべき重要なプロセスです。具体的には、ライブラリの濃度、サイズ分布、純度などを確認します。濃度測定にはリアルタイムPCR法や蛍光光度計が用いられ、リアルタイムPCR法ではアダプター配列が両端に付加された有効なライブラリのみを定量できるため、より正確な濃度を把握できます。
また、Bioanalyzerなどの機器を用いて、ライブラリのサイズ分布やアダプターダイマーの有無などを確認することも重要です。アダプターダイマーは目的外の配列であり、シーケンスデータの品質を低下させる原因となるため、適切な除去が求められます。これらの品質チェックを徹底することで、高品質なNGSデータを取得するための準備が整います。
高品質なデータを取得するために!NGS前処理で押さえるべき3つのポイント
NGS(次世代シーケンシング)で得られるデータの品質は、前処理の段階でほぼ決まります。そのため、高品質なデータを確実に取得するためには、前処理の各工程において細心の注意を払い、厳密な管理を行うことが不可欠です。本項では、前処理において特に重要となる3つのポイントを解説します。これらのポイントを実践することで、信頼性の高い解析結果へとつながり、より正確なリファレンスデータを得ることが可能になります。
ポイント1:出発点となるサンプルの品質管理を徹底する
次世代シーケンシング(NGS)におけるデータ品質は、出発点となるサンプルの品質に大きく左右されます。そのため、解析の初期段階からサンプルの品質管理を徹底することが極めて重要です。高品質なサンプルは、NGSワークフロー全体の成功と、信頼性の高いデータ取得に直結します。もしサンプルに問題がある場合、その後の解析工程でどれだけ精度の高い手法を用いても、最終的なデータ品質は低下してしまいます。シークエンシング後にサンプルの問題が発覚すると、時間とコストの無駄につながるため、NGSワークフロー全体を通してサンプルの品質を追跡し、維持管理することが不可欠です。
サンプルの品質を評価する際には、DNAやRNAの「量(Quantity)」、「完全性(Integrity)」、「純度(Purity)」の3つの側面を考慮する必要があります。例えば、DNA解析においては、鎖長の長いDNAサンプルが求められ、アガロースゲル電気泳動で15kb以上にメインバンドが現れ、低分子側にスメアバンドが出ないことが理想的です。また、純度については、吸光度を用いたOD260/OD280比が一般的に用いられ、1.8~2.1が目安とされています。不純物の混入は、その後の酵素反応などを阻害する可能性があるため、特に注意が必要です。GC含量もデータ解析の品質に影響を与える要素の一つであり、サンプルの種類によって適切なGC含量の範囲があることを理解しておくことが重要です。サンプルの種類や保存状態によって、最適な抽出プロトコルを選択し、高品質な核酸を単離することが求められます。
ポイント2:各工程で品質チェック(QC)を必ず実施する
NGSの前処理では、各工程における品質チェック(QC)の実施が非常に重要です。NGSデータ解析は「データ取得」「品質管理(QC)」「アセンブルやマッピング」「数値解析」の大きく4つのステップに分けられ、それぞれの工程でデータの品質が下流の解析結果に直接影響を及ぼすため、一貫した品質管理が不可欠となります。例えば、サンプル調製後、ライブラリ調製後、そしてシーケンス後といったNGSワークフローの様々な段階でQCを実行することが推奨されています。具体的には、生のシーケンスデータの品質を評価する際に、リード長、シーケンス深度、塩基品質、GCコンテンツなどのデータ品質メトリクスを確認します。これらの品質メトリクスを評価するためにFastQCなどのツールが利用されており、特定のシーケンシングリードセットの品質に関する包括的なレポートが提供されます。
また、アダプターのコンタミネーションはライブラリ調製時に発生し、アセンブルやマッピング結果に大きく影響を与えるため、QCの一環として正確に検出・除去する必要があります。ゲノムアセンブリの結果を評価する際は、得られたゲノム配列をリファレンス配列として用い、NGSリードのマッピング結果を検証することが一般的です。これにより、QCで除去しきれていない末端部分などの問題を発見し、適切な処置を施すことができます。このように、各工程で徹底した品質チェックを行うことで、信頼性の高いNGSデータ解析結果を得ることができます。
ポイント3:信頼性の高いプロトコルと試薬を選択する
NGSの前処理において、高品質なデータを得るためには、信頼性の高いプロトコルと試薬の選択が極めて重要です。NGS解析では、DNAやRNAといった核酸を抽出し、断片化、アダプター付加、増幅といった複雑な手順を経てライブラリーを調製します。これらの各工程で使用するプロトコルや試薬の質が、最終的なシーケンスデータの品質を大きく左右するのです。
例えば、DNA抽出プロトコルには、フェノールベースの抽出やスピンカラムを用いた方法、クロロホルムベースの抽出など様々な選択肢があります。フェノールベースの抽出は高品質なDNAが得られる一方で、操作が煩雑で汚染のリスクがあるため、より簡便で高品質なDNAを単離できる市販のキットやスピンカラムの利用も有効です。また、RNAやタンパク質などの不純物はシーケンスを妨げるため、これらを除去する手順も重要になります。アプリケーションやサンプル量に応じて、増幅の有無や方法も検討する必要があります。例えば、全ゲノムシークエンシングで出発物質が十分にある場合は増幅が不要なこともありますが、出発物質が少ない場合は増幅が不可欠です。
このように、各手順において、目的に合った適切なプロトコルを選択し、信頼性が保証された試薬を使用することで、ばらつきを抑え、再現性の高い高品質なデータを得ることが可能になります。市販のキットには、特定のNGSプラットフォームやアプリケーションに最適化されたものも多数提供されているため、それらを活用することも効率的なNGS前処理に繋がります。
まとめ
NGS前処理は、次世代シーケンス(NGS)のデータ品質を左右する非常に重要な工程です。この前処理では、まず核酸を抽出し、次にDNAを断片化してライブラリを調製し、最後に品質チェックを行います。各ステップでの品質管理(QC)を徹底し、高品質なサンプルと信頼性の高いプロトコルを選択することが、望ましいngsシーケンス結果を得るための鍵となります。適切な前処理により、その後のデータ解析の精度を向上させることが可能です。
西進商事コラム編集部
西進商事コラム編集部です。専門商社かつメーカーとしての長い歴史を持ち、精密装置やレーザー加工の最前線を発信。分析標準物質の活用も含め、さまざまなコラム発信をします。