Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
توالی یابی دنوو
توالی یابی دنوو (به انگلیسی: De novo sequence assemblers) روشی از توالی یابی ژنوم است که بدون داشتن ژنوم اولیه، قطعات کوتاه ("کانتیگ") توالی، قطعات بزرگ را تشکیل داده و توالی ژنوم یا ترانسکریپتوم را میسازند. به طور کلی دو روش حریصانه و گراف دی براین برای توالی یابی دنوو وجود دارند.
انواع روش های توالی یابی دنوو
به طور کلی دو الگوریتم در توالی یابهای دنوو استفاده میشوند. روش الگوریتم حریصانه که در آن هدف پیدا کردن بهینه محلی و الگوریتم گراف دی براین که هدف پیدا کردن بهینه جهانی است. توالی یابها برای اهداف متفاوتی مانند توالی یابی ژنوم باکتری (توالی کوتاه)، توالی یابی ژنوم یوکاریوتها (توالی بلند) و یا ترانسکریپتومها ساخته شده و مورد استفاده قرار میگیرند.
توالی یابهایی که از الگوریتمهای حریصانه استفاده میکنند بهینه محلی را با ساماندهی خواندههای کوچک مییابند. آنها ابتدا فاصله دوبهدوی خواندهها را محاسبه کرده، خواندهها را بر حسب فاصله آنها خوشهبندی کرده، از خواندهها کانتیگها را تولید کرده و این فرایند را چندین بار تکرار میکنند. اگر مجموعه خواندهها بزرگ باشد، این الگوریتمها به دلیل این که به بهینه جهانی نمیرسند، خوب عمل نمیکنند، در حالی که اگر تعداد ناحیههای تکراری در خواندهها زیاد باشد، الگوریتم های فوق بهتر عمل میکنند. نخستین توالی یابهای دنوو از الگوریتمهای حریصانه استفاده میکردند.
توالی یابهایی که از گراف استفاده میکنند به دو دسته تقسیم میشوند.گراف رشته ای و گراف دی براین. این دو روش در سال 1994 در کارگاهی توسط واترمن و جین مایرز معرفی شدند. از بین این دو روش، استفاده روش گراف دی براین متداولتر است. در توالی یابی توسط گراف دی براین، خواندهها به قطعات کوچک تری با طول یکسان k تقسیم میشوند. سپس از این k-تاییها به عنوان یال های گراف دی براین استفاده میشود. گره های این گراف از تقسیم هر k-تایی به دو k - 1-تایی به دست میآیند. به این ترتیب گراف دی براین توسط توالی یاب ساخته میشود. این توالی یابها زمانی که تعداد خواندهها زیاد باشند، بهتر از الگوریتم های حریصانه عمل میکنند.
فواید استفاده از توالی یابهای دنوو
با استفاده از توالی یاب دنوو میتوان ژنومهای طولانیتر و پیچیدهتر را توالی یابی کرد، زیرا این توالی یابها این امکان را میدهند که نواحی تکراری در ژنوم شناخته شوند. همچنین با استفاده از این نوع توالی یابها میتوان ژنوم گونههای جدید را توالی یابی کرد. به علاوه با استفاده از آنها میتوان تغییرات ساختاری مانند اضافه شدن و حذف شدن نوکلئوتایدها را در ژنوم یک گونه شناسایی کرد.
توالی یابی قطعات جفت-انتهایی
قطعات جفت-انتهایی زمانی تولید میشوند که طول قطعات مورد استفاده در توالی یابی طولانی بوده (250 تا 500 نوکلئوتاید) و دو انتهای هر قطعه خوانده میشوند. به این ترتیب در هر قطعه، انتهای چپ، راست و فاصله بین این دو انتها را میدانیم. این فاصله معمولاً از یک توزیع نرمال با واریانس و میانگین مشخص پیروی میکند. دانستن دو انتها و فاصله بین آن دو به توالی یاب کمک کرده تا قطعات توالی داده را در کنار هم به درستی قرار دهد. با ایجاد تغییر در الگوریتم گراف دی براین میتوان قطعات جفت-انتهایی را نیز توالی یابی کرد.
مراحل توالی یابیهای دنوو
- خواندن داده خام توسط فناوری های توالی خوان
- بررسی کیفیت داده
- تمیز کردن داده
- تبدیل داده به کانتیگها و اسکافلدها
- تعیین پارامترهای مورد استفاده در الگوریتم
- تعیین خروجی با استفاده از الگوریتمهای مشخص
توالی یاب ولوت
توالی یاب ولوت در گراف دی براین، تنها از خواندههای بسیار کوتاه و خواندههای جفت-انتهایی استفاده میکند. خواندههای کوتاه معمولاً برای توالی یابی در گراف دی براین مناسب نیستند زیرا تعداد تکرار بالایی داشته و در گراف ابهام ایجاد میکنند. در روش ولوت گراف دیبراین به گونه ای تغییر داده میشود تا خطاها کاهش یافته و تکرارها شناسایی شوند. این دو مرحله به صورت مستقل از هم اجرا میشوند. در ابتدا الگوریتم خطایابی ولوت توالیهایی را که به هم مربوط هستند با هم ادغام کرده و سپس الگوریتم تکرار یاب مسیرهایی که با هم، همپوشانی دارند را از هم جدا میکند.
توالی یابی ترنسکریپتوم دنوو
گذردهی بالای آر ان ای تغییری اساسی در توالی یابی ژنوم گونههایی ایجاده کرده است که ژنوم مرجع آنها وجود ندارد و یا ناقص است. این تغییر با استفاده از تحلیل ترنسکریپتوم آنها به وجود آمدهاست. هدف این روش این است که تمامی مجموعههای رونوشت موجود در داده بدون داشتن ژنوم مرجع بازسازی شوند. نتیجه این توالی یابها تهیه داده اولیه برای شناسایی تمامی رونوشت های تولید شده و ایزوفرمهای آنها است.
توالییاب های متدوال مورد استفاده
توالی یابهای متفاوت برای فناوریهای متفاوتی به کار میروند. خواندههای فناوریهای نسل دوم معمولاً کوتاه تر بوده( 50 تا 200 نوکلئوتاید) و احتمال خطایی برابر با 2 تا 5 درصد دارند. خواندههای فناوری های نسل سوم و چهارم اما طولانی تر بوده( هزار تا دههزار نوکلئوتاید) و احتمال خطایی برابر با 10 تا 20 درصد دارند. به همین دلیل به الگوریتمهای متفاوتی برای انواع خواندهها و فناوریها احتیاج است.
الگوریتم SPAdes
این الگوریتم از یک گراف دی براین ،که برای توالییابی ژنومهای کوتاهتر مانند ژنوم باکتری، ساخته شده استفاده میکند.
الگوریتم ری
به انگلیسی: Ray
این الگوریتم یک توالی یاب شامل موارد زیر است:
ری (توالی یاب دنوو تک ژنوم)، ریمتا (توالی یاب دنوو متاژنوم)، جامعه ری( فراوانی میکروب و مشخصات طبقهبندی شده)، آنتولوژی ری( طبقهبندی آنتولوژی ژن)، نقشه بردار ری( محتوای ژن را بین نمونه های متخلف مقایسه میکند). ری همچنین دارای یک رابط در سطح وب به نام مرورگر ابری ری است.
الگوریتم ABySS
یک توالی یاب دنوو موازی و جفت-انتهایی که برای توالی یابی ژنوم های طولانی از خواندههای کوتاه استفاده میشود. این توالی یاب شامل دو مدل ABySS (برای ژنوم) و Trans-ABySS (برای ترنسکریپتوم) است.
الگوریتم ALLPATHS-LG
این توالی یاب نرمافزاریست که برای توالی یابی دنوو ژنوم های بزرگ و کوتاه مورد استفاده قرار میگیرد. این نرمافزار امکان بررسی تکرارها، تصحیح خطا و استفاده از کتابخانههای مرتبط را میدهد. این نرمافزار به صورت بهینهتری از حافظه استفاده کرده و نواحی با همپوشانی کمتر را نیز توالی یابی میکند.
الگوریتم ترینتی
به انگلیسی: Trinity
این الگوریتم در سه مرحله توالی با کیفیت ترنسکریپتوم را تولید میکند. 1) با استفاده از یک الگوریتم حریصانه پس از تولید کتابخانه ای از k-تایی ها، کانتیگهای ترنسکریپتوم ایجاد میکند. 2) گراف دی براین این کانتیگها را تولید میکند. 3) با استفاده از این گراف و وفق دادن آن با خواندههای اولیه، ترنسکریپ را تولید میکند.
الگوریتم HGAP
این الگوریتم اولین توالی یاب خواندههای طولانی است که توسط گروه علوم بیولوژیکی اقیانوس آرام و موسسه ژنومیک مشترک ساخته شد.
الگوریتم فالکن
به انگلیسی: Falcon
فالکن الگوریتمی است که توسط گروه علوم بیولوژیکی اقیانوس آرام برای توالی یابی خواندههای طولانی گونه های دیپلوئد طراحی شده است.
الگوریتم کانو
به انگلیسی: Canu
این توالی یاب برای کار بر روی خواندههای طولای فناوری های نسل سوم و چهارم استفاده میشود. این توالی یاب در ادامه نسل توالی یاب سلرا است.
الگوریتم هینج
به انگلیسی: Hinge
این توالی یاب نیز برای کار بر روی خواندههای طولای فناوری های نسل سوم و چهارم استفاده میشود، اما به طور کلی برای ژنوم های کوتاهتر میکروبها طراحی شده است.