Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
توالی یابی نسل سوم
توالی یابی نسل سوم(که توالی یابی طویل-خوانش نیز نامیده میشود) یک کلاس از روشهای توالی یابی DNA میباشد که اخیراً تحت توسعه فعال قرار گرفتهاست.[۱] توالی یابی نسل سوم با خوانش توالیهای نوکلئوتیدی در سطح یک مولکول عمل میکند، بر خلاف روشهای موجود که نیازمند شکستن رشتههای طویل DNA به قطعات کوچک و سپس ایجاد توالیهای نوکلئوتیدی بوسیله تکثیر و سنتز هستند. [۲] چالشهای جدی در مهندسی ابزارهای مولکولی لازم برای توالی یابی کل ژنوم وجود دارد تا این فناوری از نظر تجاری در دسترس باشد. توالی یابی نسل دوم (توالی یابی کوتاه-خوانش)، که اغلب به عنوان توالی یابی نسل بعدی (NGS) خوانده میشود، از زمان توسعه تاکنون بر فضای توالی یلبی DNA مسلط شدهاست. این روش به طرز چشمگیری هزینه توالی یابی DNA را با یک رویکرد موازی گسترده که قادر به تولید تعداد زیادی خوانش با پوشش وسیع از کل ژنوم است، کاهش دادهاست. [۳] از آنجا که ژنوم یوکاریوتی حاوی توالیهای تکراری (DNA) است، محدودیت عمده این کلاس از روشهای توالی یابی طول خوانشهای تولید شدهاست. بهطور خلاصه، توالی یابی نسل دوم با تکثیر مولکول DNA و سپس انجام توالی یابی بواسطه سنتز انجام میشود. سیگنال فلورسنت جمعی ناشی از سنتز تعداد زیادی از رشتههای DNA یکسان تکثیر شده، اجازه استنباط هویت نوکلئوتیدی را میدهد. با این حال، به دلیل خطاهای تصادفی ، سنتز DNA بین رشتههای DNA تکثیر شده بهطور پیشرونده ای همزمان نمیباشند. به سرعت، با افزایش طول خوانش، کیفیت سیگنال بدتر میشود. به منظور حفظ کیفیت خوانش، مولکولهای طویل DNA باید به قطعات کوچک تقسیم شوند که این امر به محدودیت اساسی فناوریهای توالی یابی نسل دوم منجر میشود. [۳] تلاشهای محاسباتی با هدف غلبه بر این چالش اغلب به برآورد تقریبی تکیه دارد که ممکن است به مونتاژ دقیق توالیها منجر نشود. با قابلیت توالی یابی مستقیم مولکولهای DNA منفرد، فناوریهای توالی یابی نسل سوم این توانایی را دارند که خوانشهایی به مراتب طویل تر از توالی یابی نسل دوم داشته باشند. [۱] چنین مزیتی هم برای علم ژنوم و هم بهطور کلی در مورد زیستشناسی پیامدهای اساسی دارد. با این حال، دادههای توالی یابی نسل سوم میزان خطای بسیار بالاتری نسبت به فناوریهای قبلی دارند، که میتواند مونتاژ ژنوم پایین دست و تجزیه و تحلیل دادههای حاصل را پیچیده کند. [۴] این فناوریها بهطور فعال در حال توسعه هستند و انتظار میرود میزان خطاهای آنها کاهش یابد. برای برنامههای کاربردی که تحمل بیشتری نسبت به نرخ خطا دارند، مانند فراخوانی واریانت ساختاری، توالی یابی نسل سوم از روشهای موجود بهتر عمل میکند[نیاز به استناد].
فناوریهای حاضر
فناوریهای توالی یابی با رویکرد متفاوت نسبت به پلت فرمهای نسل دوم برای اولین بار در سال ۲۰۰۸–۲۰۰۹ به عنوان "نسل سوم" معرفی شدند. [۵] در حال حاضر چندین شرکت در مرکز توسعه فناوری توالی یابی نسل سوم قرار دارند که عبارتند از: Pacific Biosciences, Oxford Nanopore Technology, Quantapore (CA-USA) و Stratos (WA-USA). این شرکتها برای توالی یابی مولکولهای DNA منفرد رویکردهای کاملاً متفاوتی دارند. PacBio پلت فرم توالی یابی در زمان واقعی مولکول منفرد (SMRT) را بر اساس ویژگیهای موجبرهای حالت صفر توسعه داد. سیگنالها به شکل نور فلورسنت از هر نوکلئوتیدی که با DNA پلی مراز متصل به کف چاهک zL ترکیب شود، انتشار مییابند. فناوری آکسفورد نانوپور شامل عبور یک مولکول DNA از ساختار منفذ با مقیاس نانو و سپس اندازهگیری تغییرات میدان الکتریکی اطراف منفذ میباشد؛ در حالی که Quantapore یک رویکرد اختصاصی نانوپور دارد. Stratos Genomics با ورود پلی مری، بازهای DNA را خارج میکند، "Xpandomers"، برای غلبه سیگنال بر سر و صدای خوانش مولکولهای تک رشتهای DNA نانوپور استفاده میشود. همچنین رویکرد فلورسانس مولکول منفرد شرکت Helicos، قابل توجه است، اما این شرکت در پاییز سال ۲۰۱۵ ورشکسته شد.
مزایا
مزیت بارز توالی یابی نسل سوم در مقایسه با نسل حاضر فناوریهای توالی یابی، تولید خوانشهای طویل تر میباشد. انتظار میرود که این طول خوانش طولانیتر، چالشهای محاسباتی متعددی پیرامون مونتاژ ژنوم، بازسازی رونوشت و متاژنومیکس را در میان دیگر زمینههای مهم پزشکی و زیستشناسی مدرن کاهش دهد. [۱] واضح است که ژنومهای یوکاریوتی از جمله پریماتها و انسانها پیچیده هستند و تعداد زیادی مناطق طویل تکراری دارند. خوانشهای کوتاه از توالی یابی نسل دوم باید به استراتژیهای تقریبی متوسل شوند تا بتواند توالیهای طولانی را برای مونتاژ و فراخوانی واریانتهای ژنتیکی بدست آورند. برای غلبه بر این محدودیتها، خوانشهای دو طرفه توالی یابی نسل دوم اعمال شدهاست. با این حال، طول دقیق قطعه دو طرفه خوانده شده اغلب ناشناخته است و لذا باید تخمین زده شود. مزایای فناوریهای توالی یابی نسل سوم با ممکن ساختن خوانشهای طویل واضح میباشد.
اپی ژنتیک
نشانگرهای اپی ژنتیکی تغییرات پایدار و بالقوه ارثی در مولکول DNA میباشند که در توالی آن نیستند. یک مثال متیلاسیون DNA در محلهای CpG است که مشخص شدهاست بر بیان ژن تأثیر میگذارد. یک نمونه دیگر تغییرات هیستونی میباشد. نسل حاضر فناوریهای توالی یابی برای تشخیص نشانگرهای اپی ژنتیکی به روشهای آزمایشگاهی مانند توالی یابی ChIP متکی هستند. این روشها شامل برچسب زدن به رشته DNA، شکستن و فیلتر کردن قطعاتی است که حاوی نشانگر هستند و به دنبال آن توالی یابی. توالی یابی نسل سوم ممکن است به دلیل سیگنال متمایز از چهار باز دیگر نوکلئوتیدی، شناسایی مستقیم این نشانگرها را ممکن سازد. [۶]
قابلیت حمل و سرعت
از دیگر مزایای مهم فناوریهای توالی یابی نسل سوم میتوان به قابلیت حمل و سرعت توالی یابی اشاره نمود. [۷] از آنجا که حداقل پردازش نمونه در مقایسه با توالی یابی نسل دوم مورد نیاز است، امکان طراحی تجهیزات در اندازه کوچک وجود دارد. اخیراً شرکت Oxford Nanopore Technology دستگاه توالی یابی Minion را تجاری کردهاست. این دستگاه توالی یابی تقریباً اندازه فلش مموری USB معمولی است و با اتصال به لپ تاپ به راحتی قابل استفاده است. علاوه بر این، از آنجا که فرایند توالی یابی در مناطق ژنوم موازی نیست، دادهها را میتوان در زمان واقعی جمعآوری و تجزیه و تحلیل کرد. این مزایای توالی یابی نسل سوم ممکن است در بیمارستان که نیازمند جمعآوری و تجزیه و تحلیل سریع دادهها است، مناسب باشد.
چالشها
توالی یابی نسل سوم، همانطور که در حال حاضر مواجه است، با چالشهای مهمی که عمدتاً در شناسایی دقیق بازهای نوکلئوتیدی وجود دارد روبرو است. نرخ خطا در مقایسه با توالی نسل دوم هنوز بسیار بیشتر است. [۴] این امر بهطور کلی به دلیل ناپایداری ماشینهای مولکولی درگیر میباشد. به عنوان مثال، در فناوری توالی یابی مولکولی منفرد و زمان واقعی PacBio، مولکول DNA پلی مراز همانطور که روند توالی یابی انجام میشود، بهطور فزاینده ای آسیب میبیند. [۴] علاوه بر این، از آنجا که این روند به سرعت اتفاق میافتد، ممکن است سیگنالهایی که توسط بازهای منفرد خاموش میشوند با سیگنالهای بازهای همسایه محو شوند. این یک چالش محاسباتی جدید برای رمزگشایی سیگنالها و در نتیجه استنباط توالی است. به عنوان مثال، بدین منظور روشهایی مانند مدلهای مارکوف پنهان با موفقیتهایی به کار گرفته شدهاست. [۶] بهطور متوسط، حدود ۹۹٫۹٪ از ژنهای افراد مختلف جمعیت انسانی مشترک میباشد. به عبارت دیگر، تقریباً از هر هزار باز فقط یک بازبین دو فرد متفاوت است. نرخ خطای بالای ناشی از توالی یابی نسل سوم به منظور تعیین تفاوتهای فردی بین اعضای یک گونه، ناگزیر مشکل ساز است.
مونتاژ ژنوم
مونتاژ ژنوم بازسازی توالی DNA کل ژنوم است. این بهطور کلی با دو رویکرد کاملاً متفاوت انجام میشود.
ردیف سازی مرجع
هنگامی که یک ژنوم مرجع در دسترس باشد، همانطور که در مورد انسان وجود دارد، خوانشهای توالی تازه میتوانند به منظور تعیین خصوصیات آن با ژنوم مرجع ردیف شوند. چنین مونتاژ مبتنی بر مرجع سریع و آسان است اما عیب آن «پنهان کردن» توالیهای جدید و واریانتهای تعداد نسخه بزرگ میباشد. علاوه بر این، ژنوم مرجع برای اکثر ارگانیسمها هنوز وجود ندارند.
مونتاژ از نو
مونتاژ از نو روش جایگزین مونتاژ ژنوم برای ردیف سازی مرجع است. این کاملاً به بازسازی توالیهای کل ژنوم از خوانشهای توالی خام بر میگردد. این روش زمانی انتخاب میشود که ژنوم مرجع وجود نداشته باشد، هنگامی که گونه ارگانیسم مورد نظر ناشناخته باشد مثل متاژنومیکس، یا هنگامی که واریانتهای ژنتیکی مورد نظر با ردیف سازی ژنوم مرجع تشخیص داده نمیشوند. با توجه به خوانشهای کوتاه تولید شده توسط نسل حاضر فناوریهای توالی یابی، مونتاژ از نو یک مشکل بزرگ محاسباتی است. بهطور معمول با یک روند تکرار شونده برای یافتن و اتصال خوانشهای توالی با همپوشانی معقول خوانده میشود، نزدیک میشوید. روشهای مختلف محاسباتی و آماری مانند نمودارهای de bruijn و نمودارهای مورد توافق طرح همپوشان، برای حل این مشکل به کار گرفته شدهاست. با این وجود، با توجه به ماهیت بسیار تکراری ژنوم یوکاریوتی، بازسازی دقیق و کامل توالی ژنوم در مونتاژ از نو چالشبرانگیز است. خوانشهای دو طرفه به عنوان یک راه حل ممکن مطرح شدهاست، اگرچه طول قطعه دقیقاً شناخته شده نیست و باید تقریبی محاسبه شود. [۸] مونتاژ دورگه - استفاده از خوانشهای موجود در پلت فرم توالی یابی نسل سوم با خوانشهای کوتاه پلت فرم نسل دوم - ممکن است برای رفع ابهامات در ژنومهایی که قبلاً با استفاده از توالی یابی نسل دوم مونتاژ شدهاند، استفاده شود. از خوانشهای کوتاه نسل دوم نیز برای اصلاح خطاهایی که در خوانشهای طویل نسل سوم وجود دارد، استفاده میگردد.
مونتاژ دورگه
خوانش طویل که توسط توالی یابی نسل سوم ارائه شدهاست، میتواند بسیاری از چالشهای کنونی که مونتاژ ژنومی از نو با آن مواجه میشود را کاهش دهد. به عنوان مثال، اگر کل یک منطقه تکراری بتواند بهطور واضح در یک خوانش توالی یابی شود، هیچ نتیجهگیری محاسبه ای دیگری لازم نیست. روشهای محاسباتی برای کاهش میزان خطای بالا پیشنهاد شدهاند. به عنوان مثال، در یک مطالعه، نشان داده شد که مونتاژ از نو ژنوم میکروبی با استفاده از توالی یابی PacBio به تنهایی عملکرد برتری از توالی یابی نسل دوم دارد. [۹] توالی یایی نسل سوم ممکن است همچنین همراه با توالی یابی نسل دوم نیز استفاده شود. به این روش اغلب به عنوان توالی یابی دورگه اشاره میشود. به عنوان مثال، خوانشهای طویل از توالی یابی نسل سوم ممکن است برای رفع ابهامات در ژنومهایی که قبلاً با استفاده از توالی یابی نسل دوم مونتاژ شدهاند، استفاده گردد. از طرف دیگر، خوانشهای توالی یابی نسل دوم کوتاه، برای اصلاح خطاهای موجود در خوانشهای طویل نسل سوم استفاده شدهاست. بهطور کلی، این رویکرد دورگه بهطور قابل توجهی موجب بهبود مونتاژ ژنوم از نو میشود. [۱۰]
نشانگرهای اپی ژنتیکی
متیلاسیون DNA (DNAm)-تغییر کووالانسی DNA در محلهای CpG که منجر به اتصال گروههای متیل میشود - بهترین جزء قابل درک ماشین اپی ژنتیک است. تغییرات DNA و بیان ژن ناشی از آن میتواند در انواع سلولها متفاوت باشد. دوره تکوین، با دودمان ژنتیکی، به دلیل محرکهای محیطی میتواند تغییر کند و قابل توارث هستند. محققان پس از کشف DNAm، همبستگی آن را با بیماریهایی مانند سرطان و اوتیسم نیز پیدا کردند. [۱۱] در سببشناسی این بیماریها بستر DNAm یک راه مهم برای تحقیقات بیشتر است.
مزایا
متداولترین روشهای حاضر برای بررسی وضعیت متیلاسیون نیازمند سنجش قطعات DNA قبل از توالی یابی نسل دوم استاندارد، بر روی پلت فرم Illumina میباشد. در نتیجه خوانش کوتاه، اطلاعات مربوط به الگوهای طولانیتر متیلاسیون از بین میرود. [۶] فناوریهای توالی یابی نسل سوم، قابلیت توالی یابی مولکولهای منفرد در زمان واقعی را از خوانشهای طویل تر و شناسایی تغییرات DNA بدون سنجشهایی که ذکر شد را ارائه میدهد. [۱۲] فناوری PacBio SMRT و Oxford Nanopore میتوانند از DNA تغییر نیافته برای تشخیص متیلاسیون استفاده کنند. دستگاه MinION شرکت Oxford Nanopore Technologgies برای تشخیص DNAm استفاده شدهاست. از آنجا که هر رشته DNA از یک منفذ عبور میکند، سیگنالهای الکتریکی تولید میکند که مشخص شده به تغییرات اپی ژنتیکی موجود در نوکلئوتیدها حساس هستند و از یک مدل مارکوف پنهان (HMM) برای تجزیه و تحلیل دادههای MinION برای شناسایی تغییرات ۵-متیل سیتوزین (5mC) DNA استفاده شدهاست. اصلاح. [۶] این مدل با استفاده از DNA متیله شدهE. coli که بهصورت مصنوعی سنتز شده و سیگنالهای حاصل از آن که با استفاده از فناوری نانوپور اندازهگیری شدهاست، ارایه دادهاست. پس از آن، مدل برای تشخیص ۵- متیل سیتوزین در خوانشهای ژنومیک MinION حاصل از یک رده سلولی انسانی که قبلاً یک متیلوم مرجع داشت، استفاده شد. طبقهبندی کننده دارای دقت ۸۲٪ در محلهای تک نمونه ای تصادفی است، هنگامی که از حد آستانههای سخت گیرانه استفاده شود تا ۹۵٪ افزایش مییابد. [۶] روشهای دیگر، انواع مختلفی از تغییرات DNA را با استفاده از پلت فرم MinION ارائه میدهند. استویبر و همکاران ۴-متیل سیتوزین (4-mC) و ۶-متیل آدنین (6mA) را به همراه ۵-متیل سیتوزین (5mC) مورد بررسی قرار دادند، و همچنین یک نرمافزار ایجاد کردند تا مستقیماً دادههای خام MinION را به روش آسانی بصری کند. [۱۳] در اینجا آنها دریافتند که در E. coli، که دارای متیلوم شناخته شدهاست، میتوان از پنجرههای رویداد به طول ۵ جفت باز برای تقسیم و تجزیه و تحلیل آماری سیگنالهای الکتریکی خام MinION استفاده نمود. یک آزمون ساده Mann-Whitney U test میتواند بخشهای تغییر یافته از توالی E. coli را تشخیص دهد، و همچنین تغییرات را به مناطق 4mC، 6mA یا 5mC تقسیم کند. [۱۳] به نظر میرسد در آینده از دادههای خام MinION برای تشخیص بسیاری از علائم گوناگون اپی ژنتیکی در DNA استفاده شود. برای تعیین متیلاسیون DNA از توالی یابی PacBio نیز استفاده شدهاست. در این پلت فرم گستره پالس - گستره یک پالس نور فلورسنت - به یک باز خاص مربوط میشود. در سال ۲۰۱۰ نشان داده شد که فاصله بینابینی در نمونههای شاهد و متیله شده متفاوت است و برای هر نوع متیلاسیون یک گستره پالس «منحصر به فرد» وجود دارد. [۱۲] در سال ۲۰۱۲ با استفاده از پلت فرم PacBio، محلهای اتصال DNA متیل ترانسفرازها مشخص شد. [۱۴] شناسایی متیلاسیون N6 در کرم C Elegans در سال ۲۰۱۵ نشان داده شد. [۱۵] متیلاسیون DNA روی N6-adenine با استفاده از پلت فرم PacBio در سلولهای بنیادی جنینی موش در سال ۲۰۱۶ نشان داده شد. [۱۶] اشکال دیگری از تغییرات DNA -ناشی از فلزات سنگین، اکسیداسیون یا آسیب با اشعه فرا بنفش - نیز راههای تحقیقاتی هستند که با استفاده از توالی یابی نسل سوم Oxford Nanopore و PacBio امکانپذیر میباشند.
معایب
پردازش دادههای خام - مانند نرمال سازی با سیگنال میانگین - بر روی دادههای خام MinION نیاز بود و باعث کاهش توانایی در زمان واقعی فناوری میشد. [۱۳] پایداری سیگنالهای الکتریکی هنوز یک معضل است و فراخوانی دقیق نوکلئوتید را دشوار میکند. MinION توان عملیاتی کمی دارد؛ از آنجا که خوانشهای هم پوشان متعدد بسیار دشوار بدست میآیند، این خوانشهای بیشتر، منجر به رفع مشکلات شناسایی تغییرات پایین دست DNA میشود هم مدل مارکوف پنهان و هم روشهای آماری که از دادههای خام MinION استفاده نمودهاست نیازمند مشاهدات مکرر از تغییرات DNA برای تشخیص میباشد، به این معنی که نوکلئوتیدهای تغییر یافته منفرد باید بهطور مداوم در چندین نسخه از ژنوم حضور داشته باشند، به عنوان مثال در چندین سلول یا پلاسمید موجود در نمونه. برای پلت فرم PacBio نیز بسته به نوع متیلاسیون دلخواه، نیازهای پوشش متفاوت است. از مارس ۲۰۱۷، سایر عوامل اپی ژنتیکی مانند تغییرات هیستونی با استفاده از فناوریهای نسل سوم قابل کشف نیستند. الگوهای طویل متیلاسیون غالباً بعلت اینکه هنوز نیاز به مونتاژ کانتیگهای کوچکتر است، از بین میروند.
ترانسکریپتومیکس
ترانسکریپتومیکس به معنی مطالعه ترانسکریپتوم است، معمولاً بعنوان فراوانی نسبی مولکولهای mRNA بافت مورد مطالعه توصیف میشود. با توجه اصل بنیادین زیستشناسی مولکولی، اطلاعات ژنتیکی از مولکولهای DNA دو رشتهای به مولکولهای mRNA تک رشتهای جریان مییابند جایی که میتوانند به آسانی به مولکولهای پروتئین عملکرد ی ترجمه شوند. با مطالعه ترانسکریپتوم، میتوانید درک ارزشمندی در تنظیم بیان ژن کسب کنید. در حالی که میزان بیان به عنوان میزان ژن میتواند کم و بیش بهطور دقیق توسط توالی یابی نسل دوم به تصویر کشیده شود، اطلاعات میزان رونوشت هنوز یک چالش مهم است. [۱۷] در نتیجه، نقش پیرایش متناوب در زیستشناسی مولکولی تا حد زیادی مبهم است. فناوریهای توالی یابی نسل سوم با توالی یابی کامل مولکولهای mRNA، چشمانداز امیدوار کننده ای برای حل این مسئله دارند.
پیرایش متناوب
پیرایش متناوب (AS) فرایندی است که با استفاده از آن یک ژن واحد میتواند چندین نسخه متمایز mRNA و در نتیجه ترجمههای پروتئینی متفاوتی ایجاد کند. [۱۸] برخی شواهد نشان میدهد که پیرایش متناوب یک پدیده همه جایی است و ممکن است نقش مهمی در تعیین فنوتیپهای موجودات زنده بهویژه در یوکاریوتهای پیچیده ایفا کند. همه یوکاریوتها حاوی ژنهایی هستند که از اینترونها تشکیل شدهاند. بهطور خاص، تخمین زده شدهاست که پیرایش متناوب در ۹۵٪ از کل ژنهای چند اگزون انسانی رخ میدهد. [۱۹] پیرایش متناوب پتانسیل غیرقابل انکاری بر بسیاری از روندهای زیستی دارد. پیشرفت دانش در این زمینه بهطور کلی پیامدهای اساسی برای مطالعه زیستشناسی دارد.
بازسازی رونوشت
نسل حاضر فناوریهای توالی یابی فقط خوانشهای کوتاه را تولید میکند، که محدودیت فوقالعاده ای در توانایی تشخیص رونوشتهای مجزا ایجاد میکند. خوانشهای کوتاه باید با مهندسی معکوس به رونوشتهای اصلی تبدیل شوند که میتواند منجر به مشاهده خوانشها گردد. [۲۰] این وظیفه توسط میزان بیان بسیار متغیر در رونوشتها و در نتیجه پوشش متغیر خوانش توالی ژن پیچیدگی بیشتری مییابد. [۲۰] علاوه بر این، اگزونها ممکن است در میان رونوشتهای خاصی به اشتراک گذاشته شوند، لذا تفسیر واضح اساساً غیرممکن است. [۱۸] روشهای محاسباتی موجود، تفسیرها را بر اساس تجمع خوانشهای کوتاه در توالیهای مختلف اغلب با ساختن فرضیات ساده انجام میدهد. [20] Cufflinks، یک رویکرد صرفه جویانه ای را در پیش میگیرد و در پی توضیح همه خوانشها با کمترین تعداد ممکن از رونوشتها است. [۲۱] از سوی دیگر، StringTie تلاش میکند تا ضمن جمعآوری خوانشها، فراوانی رونوشتها را هم برآورد کند. [۲۰] این روشها، اگرچه منطقی هستند، همیشه رونوشتهای واقعی را نمیتوانند شناسایی کنند. مطالعه ای که در سال ۲۰۰۸ منتشر شد، ۲۵ پروتکل مختلف موجود در بازسازی رونوشت را مورد بررسی قرار داد. [۱۷] این شواهد نشان میدهد که روشهای موجود معمولاً در مونتاژ رونوشتها ضعیف هستند، اگرچه توانایی تشخیص اگزونهای منفرد را بهطور نسبتاً بی عیبی دارند. [۱۷] طبق برآوردها، میانگین حساسیت تشخیص اگزونها در ۲۵ پروتکل برای ژنهای کرم Caenorhabditis elegans 80% است. [۱۷] در مقابل، حساسیت شناسایی رونوشتها به ۶۵٪ کاهش مییابد. بر اساس نتایج این مطالعه در انسان، میانگین حساسیت تشخیص اگزون ۶۹٪ و میانگین حساسیت تشخیص رونوشتها تنها ۳۳٪ میباشد. [۱۷] به عبارت دیگر، برای انسان، روشهای موجود قادر به شناسایی کمتر از نیمی از کل رونوشتهای موجود هستند. فناوریهای توالی یابی نسل سوم چشمانداز امیدوار کننده ای در حل مسئله تشخیص رونوشت و همچنین برآورد فراوانی mRNA در سطح رونوشتها نشان دادهاست. در حالی که نرخ خطا همچنان بالاست، فناوریهای توالی یابی نسل سوم این توانایی را دارند که طول خوانش بسیار بیشتری داشته باشند. [۲۲] شرکت Pacific Bioscience پلت فرم iso-seq را معرفی کردهاست و ادعا میکند که مولکولهای mRNA را در طول کاملشان توالی یابی میکند.[۲۲] پیشبینی میشود شرکتOxford Nanopore فناوریهای مشابهی را ارائه دهد. مشکلی که در نرخ خطای بالاتر وجود دارد ممکن است با خوانشهای کوتاه با کیفیت بالا کاهش یابد. این روش قبلاً آزمایش شده و گزارش شدهاست که میزان خطا را بیش از ۳ برابر کاهش میدهد. [۲۳]
متاژنومیکس
متاژنومیکس آنالیز مواد ژنتیکی است که بهطور مستقیم از نمونههای محیطی بازیابی میشود.
مزایا
مهمترین مزیت فناوریهای توالی یابی نسل سوم در متاژنومیکس سرعت توالی یابی آنها در مقایسه با روشهای نسل دوم است. سرعت توالی یابی برای مثال در کلینیک (مانند شناسایی پاتوژن) از اهمیت زیادی برخوردار است، تا امکان تشخیص کارآمد و اقدامات بالینی به موقع فراهم شود. دستگاه Minion شرکت آکسفورد نانوپور در سال ۲۰۱۵ برای تشخیص متابوژنومیک در زمان واقعی پاتوژنها در نمونههای بالینی پیچیده و با پر خطر استفاده شد. اولین ویروس ابولا (EBV) 44 ثانیه پس از جمعآوری دادهها توالی یابی شد. [۲۴] در اینجا نقشه خوانی یکنواخت برای خوانشهای ژنوم وجود داشت. حداقل یک خوانش با بیش از ۸۸٪ ژنوم نقشهبرداری شده مطابقت داشت. خوانشهای نسبتاً طویل، توالی یابی تقریباً کامل ژنوم ویروسی را با دقت بالا (مطابقت ۹۷–۹۹٪) مستقیماً از یک نمونه بالینی اولیه امکانپذیر میسازد. [۲۴] یک نشانگر فیلوژنتیک رایج برای مطالعات تنوع جامعه میکروبی ژن RNA ریبوزومی S 16 است. پلت فرمهای SMRT Minion و PacBio برای توالی یابی این ژن استفاده شدهاند. [۲۵] [۲۶] در این زمینه، میزان خطای PacBio قابل مقایسه با خوانشهای کوتاهتر ۴۵۴ و پلت فرم دستگاه MiSeq شرکت Illumina است. [نیاز به استناد]
معایب
میزان خطای بالای MinION (40%-10) از شناسایی نشانگرهای مقاومت ضد میکروبی جلوگیری میکند، که بدین منظور تفکیک تک نوکلئوتیدی لازم است. به همین علت، پاتوژنهای یوکاریوتی شناسایی نشدهاند. [۲۴] همچنین سهولت انتقال آلودگی هنگام استفاده مجدد از flow cell (دستورالعملهای شستشوی استاندارد کار نمیکنند) نگران کننده است. بارکدهای منحصر به فرد ممکن است امکان تعدد آزمایش را فراهم کنند. علاوه بر این، انجام شناسایی دقیق گونههای باکتریایی، قارچ و انگلها بسیار دشوار است، زیرا آنها بخش بیشتری از ژنوم را به اشتراک میگذارند، برخی از آنها تنها کمتر از ۵٪ تفاوت دارند. هزینه توالی یابی هر باز هنوز هم بهطور قابل توجهی بیشتر از MiSeq است. با این حال، چشمانداز تکمیل پایگاههای دادههای مرجع با توالیهای کامل از موجوداتی که زیر حد تشخیص رویکرد سانگر هستند؛ [۲۵] احتمالاً میتواند تا حد زیادی در شناسایی ارگانیسمها در متاژنومیکس کمک کند.
جستارهای وابسته
1 Bleidorn, Christoph (2016-01-02). "Third generation sequencing: technology and its potential impact on evolutionary biodiversity research". Systematics and Biodiversity. 14 (1): 1–8. doi:10.1080/14772000.2015.1099575. ISSN 1477-2000.
2. ^ "Illumina sequencing technology" (PDF).
3. ^ Jump up to:a b c Treangen, Todd J. ; Salzberg, Steven L. (2012-01-01). "Repetitive DNA and next-generation sequencing: computational challenges and solutions". Nature Reviews Genetics. 13 (1): 36–46. doi:10.1038/nrg3117. ISSN 1471-0056. PMC 3324860. PMID 22124482.
4. ^ Jump up to:a b c Gupta, Pushpendra K. (2008-11-01). "Single-molecule DNA sequencing technologies for future genomics research". Trends in Biotechnology. 26 (11): 602–611. doi:10.1016/j.tibtech.2008.07.003. PMID 18722683.
5. ^ Check Hayden, Erika (2009-02-06). "Genome sequencing: the third generation". Nature News. 457 (7231): 768–769. doi:10.1038/news.2009.86. PMID 19212365.
6. ^ Jump up to:a b c d e Simpson, Jared T. ; Workman, Rachael; Zuzarte, Philip C. ; David, Matei; Dursi, Lewis Jonathan; Timp, Winston (2016-04-04). "Detecting DNA Methylation using the Oxford Nanopore Technologies MinION sequencer". bioRxiv 10.1101/047142.
7. ^ Schadt, E. E. ; Turner, S. ; Kasarskis, A. (2010-10-15). "A window into third-generation sequencing". Human Molecular Genetics. 19 (R2): R227–R240. doi:10.1093/hmg/ddq416. ISSN 0964-6906. PMID 20858600.
8. ^ Li, Ruiqiang; Zhu, Hongmei; Ruan, Jue; Qian, Wubin; Fang, Xiaodong; Shi, Zhongbin; Li, Yingrui; Li, Shengting; Shan, Gao (2010-02-01). "De novo assembly of human genomes with massively parallel short read sequencing". Genome Research. 20 (2): 265–272. doi:10.1101/gr.097261.109. ISSN 1088-9051. PMC 2813482. PMID 20019144.
9. ^ Chin, Chen-Shan; Alexander, David H. ; Marks, Patrick; Klammer, Aaron A. ; Drake, James; Heiner, Cheryl; Clum, Alicia; Copeland, Alex; Huddleston, John (2013-06-01). "Nonhybrid, finished microbial genome assemblies from long-read SMRT sequencing data". Nature Methods. 10 (6): 563–569. doi:10.1038/nmeth.2474. ISSN 1548-7091. PMID 23644548.
10. ^ Goodwin, Sara; Gurtowski, James; Ethe-Sayers, Scott; Deshpande, Panchajanya; Schatz, Michael C. ; McCombie, W. Richard (2015-11-01). "Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome". Genome Research. 25(11): 1750–1756. doi:10.1101/gr.191395.115. ISSN 1088-9051. PMC 4617970. PMID 26447147.
11. ^ Fraser, Hunter B. ; Lam, Lucia L. ; Neumann, Sarah M. ; Kobor, Michael S. (2012-02-09). "Population-specificity of human DNA methylation". Genome Biology. 13 (2): R8. doi:10.1186/gb-2012-13-2-r8. ISSN 1474-760X. PMC 3334571. PMID 22322129.
12. ^ Jump up to:a b Flusberg, Benjamin A. ; Webster, Dale R. ; Lee, Jessica H. ; Travers, Kevin J. ; Olivares, Eric C. ; Clark, Tyson A. ; Korlach, Jonas; Turner, Stephen W. (2010-06-01). "Direct detection of DNA methylation during single-molecule, real-time sequencing". Nature Methods. 7 (6): 461–465. doi:10.1038/nmeth.1459. PMC 2879396. PMID 20453866.
13. ^ Jump up to:a b c Stoiber, Marcus H. ; Quick, Joshua; Egan, Rob; Lee, Ji Eun; Celniker, Susan E. ; Neely, Robert; Loman, Nicholas; Pennacchio, Len; Brown, James B. (2016-12-15). "De novo Identification of DNA Modifications Enabled by Genome-Guided Nanopore Signal Processing". bioRxiv 10.1101/094672.
14. ^ Clark, T. A. ; Murray, I. A. ; Morgan, R. D. ; Kislyuk, A. O. ; Spittle, K. E. ; Boitano, M. ; Fomenkov, A. ; Roberts, R. J. ; Korlach, J. (2012-02-01). "Characterization of DNA methyltransferase specificities using single-molecule, real-time DNA sequencing". Nucleic Acids Research. 40 (4): e29. doi:10.1093/nar/gkr1146. ISSN 0305-1048. PMC 3287169. PMID 22156058.
15. ^ Greer, Eric Lieberman; Blanco, Mario Andres; Gu, Lei; Sendinc, Erdem; Liu, Jianzhao; Aristizábal-Corrales, David; Hsu, Chih-Hung; Aravind, L. ; He, Chuan (2015). "DNA Methylation on N6-Adenine in C. elegans". Cell. 161 (4): 868–878. doi:10.1016/j.cell.2015.04.005. PMC 4427530. PMID 25936839.
16. ^ Wu, Tao P. ; Wang, Tao; Seetin, Matthew G. ; Lai, Yongquan; Zhu, Shijia; Lin, Kaixuan; Liu, Yifei; Byrum, Stephanie D. ; Mackintosh, Samuel G. (2016-04-21). "DNA methylation on N6-adenine in mammalian embryonic stem cells". Nature. 532 (7599): 329–333. Bibcode:2016Natur.532..329W. doi:10.1038/nature17640. ISSN 0028-0836. PMC 4977844. PMID 27027282.
17. ^ Jump up to:a b c d e Steijger, Tamara; Abril, Josep F. ; Engström, Pär G. ; Kokocinski, Felix; The RGASP Consortium; Hubbard, Tim J. ; Guigó, Roderic; Harrow, Jennifer; Bertone, Paul (2013-12-01). "Assessment of transcript reconstruction methods for RNA-seq". Nature Methods. 10 (12): 1177–1184. doi:10.1038/nmeth.2714. ISSN 1548-7091. PMC 3851240. PMID 24185837.
18. ^ Jump up to:a b Graveley, Brenton R. (2001). "Alternative splicing: increasing diversity in the proteomic world". Trends in Genetics. 17 (2): 100–107. doi:10.1016/s0168-9525(00)02176-4. PMID 11173120.
19. ^ Pan, Qun; Shai, Ofer; Lee, Leo J. ; Frey, Brendan J. ; Blencowe, Benjamin J. (2008-12-01). "Deep surveying of alternative splicing complexity in the human transcriptome by high-throughput sequencing". Nature Genetics. 40 (12): 1413–1415. doi:10.1038/ng.259. ISSN 1061-4036. PMID 18978789.
20. ^ Jump up to:a b c d Pertea, Mihaela; Pertea, Geo M. ; Antonescu, Corina M. ; Chang, Tsung-Cheng; Mendell, Joshua T. ; Salzberg, Steven L. (2015-03-01). "StringTie enables improved reconstruction of a transcriptome from RNA-seq reads". Nature Biotechnology. 33 (3): 290–295. doi:10.1038/nbt.3122. ISSN 1087-0156. PMC 4643835. PMID 25690850.
21. ^ Trapnell, Cole; Williams, Brian A. ; Pertea, Geo; Mortazavi, Ali; Kwan, Gordon; van Baren, Marijke J. ; Salzberg, Steven L. ; Wold, Barbara J. ; Pachter, Lior (2010-05-01). "Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation". Nature Biotechnology. 28 (5): 511–515. doi:10.1038/nbt.1621. ISSN 1087-0156. PMC 3146043. PMID 20436464.
22. ^ Jump up to:a b Abdel-Ghany, Salah E. ; Hamilton, Michael; Jacobi, Jennifer L. ; Ngam, Peter; Devitt, Nicholas; Schilkey, Faye; Ben-Hur, Asa; Reddy, Anireddy S. N. (2016-06-24). "A survey of the sorghum transcriptome using single-molecule long reads". Nature Communications. 7: 11706. Bibcode:2016NatCo...711706A. doi:10.1038/ncomms11706. ISSN 2041-1723. PMC 4931028. PMID 27339290.
23. ^ Au, Kin Fai; Underwood, Jason G. ; Lee, Lawrence; Wong, Wing Hung (2012-10-04). "Improving PacBio Long Read Accuracy by Short Read Alignment". PLOS ONE. 7 (10): e46679. Bibcode:2012PLoSO...746679A. doi:10.1371/journal.pone.0046679. ISSN 1932-6203. PMC 3464235. PMID 23056399.
24. ^ Jump up to:a b c Greninger, Alexander L. ; Naccache, Samia N. ; Federman, Scot; Yu, Guixia; Mbala, Placide; Bres, Vanessa; Stryke, Doug; Bouquet, Jerome; Somasekar, Sneha (2015-01-01). "Rapid metagenomic identification of viral pathogens in clinical samples by real-time nanopore sequencing analysis". Genome Medicine. 7: 99. doi:10.1186/s13073-015-0220-9. ISSN 1756-994X. PMC 4587849. PMID 26416663.
25. ^ Jump up to:a b Schloss, Patrick D. ; Jenior, Matthew L. ; Koumpouras, Charles C. ; Westcott, Sarah L. ; Highlander, Sarah K. (2016-01-01). "Sequencing 16S rRNA gene fragments using the PacBio SMRT DNA sequencing system". PeerJ. 4: e1869. doi:10.7717/peerj.1869. PMC 4824876. PMID 27069806.
26. ^ Benítez-Páez, Alfonso; Portune, Kevin J. ; Sanz, Yolanda (2016-01-01). "Species-level resolution of 16S rRNA gene amplicons sequenced through the MinION™ portable nanopore sequencer". GigaScience. 5: 4. doi:10.1186/s13742-016-0111-z. ISSN 2047-217X. PMC 4730766. PMID 26823973.
متن چپچینشده