Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
الگوریتم ناسینوف
الگوریتم ناسینوف (Nussinov Algorithm) حداکثر تعداد جفت بازهای ممکن یک توالی اسید نوکلئیک داده شده را محاسبه میکند. در مرحلهٔ بعدتر، ساختار دوم با حداکثر تعداد جفت بازها(base pair) میتواند ساخته شود. این الگوریتم روشهای برنامه نویسی پویا را به کار می برد.
الگوریتم
طول توالی ورودی است. N یک ماتریس در است و تابع اگر مکمل باشد،(یعنی باهم پیوند بازی تشکیل دهند) 1 برمی گرداند و درغیراین صورت 0 برمی گرداند.
پیوندهای بازی مجاز نیستند که باهم تداخل داشته باشند. برای جفت بازهایی با اندیسهای
با شرط و اندیسهای با شرط
هیچ پیوندی یا ایجاد نمیشود.
زیررشتهٔ که با نمایش میشود، زیررشتهٔ به طول 1 و زیررشتهٔ که با نمایش داده میشود، زیررشتهٔ به طول 0 یا همان زیررشتهٔ تهی نامیده میشود.
مقداردهی اولیه
زیررشتهٔ به طول 1 و زیررشتهٔ تهی به طول 0 شامل حداکثر 0 جفت باز است.(یعنی هیچ وقت i با خودش پیوند بازی تشکیل نمیدهد.)
رابطهٔ بازگشتی
در انتهای الگوریتم در خانهٔ ماتریس N ، تعداد ماکزیمم جفت بازهای زیررشتههای از به دست می آید. به طوری که حداکثر تعداد جفت بازهای ممکن توالی ورودی کلی در ذخیره شدهاست.
موارد متمایز در رابطهٔ بازگشتی دو مورد میباشد . یا اینکه در زیررشتهٔ حداکثر تعداد جفت بازها محاسبه شدهاست و در حال حاضر هدف گسترش آن با یک باز است که با هیچ باز دیگری جفت نشدهاست. یا بهطور کامل تر باز با یک باز دیگر در پیوند تشکیل دهد.
در مورد دوم k تا باز ممکن وجود دارد که میتواند جفت باز تشکیل دهد.انتخاب باز مکمل ، زیررشتههای را به دو زیررشتهٔ
و تقسیم میکند و اینها طوری به هم وصل میشوند که حداکثر تعداد جفت بازها به صورت بازگشتی محاسبه شود.
اگر مکمل باشد، مقدار تابع ،
و در غیراین صورت است.
تمایز موارد مطابق با گرامر مستقل از متن زیر است :
به طوریکه به یک بازِ جفت نشده(تنها) اشاره میکند و براکت نشان دهندهٔ همهٔ متغیرهای جفت بازهای مکمل ممکن است. پس از این گرامر همهٔ ساختارهای به دست آمده از الگوریتم ناسینوف می توانند بهینه تلقی شوند.
ساختار دوم شامل ماکزیمم تعداد پیوندهای بازی است که می توانند توسط روش برگشت به عقب از خانهٔ ماتریس به دست آیند. یعنی روی ماتریس مسیرهای برگشتی وجود دارد که نتیجهٔ بهینه در را می دهند و این الگوریتم برگشت به عقب عملیاتی را انجام میدهد که مسیرهای بهینهٔ ساختار دوم را تولید میکند.
کارایی
الگوریتم یک ماتریسی با درایه به کار می برد، بنابراین به حافظه نیاز دارد و هر درایه از طریق عنصر بهینه خواهد شد پس زمان اجرای الگوریتم است.
علامت گذاری
مشخصات ماتریس بالا مطابق با نمایش ناسینوف بازگشتی در سال 1978 میباشد . گاهی اوقات به ادبیات اخیر به عنوان یک تنوعی برای این الگوریتم ناسینوف بازگشتی اشاره شدهاست(z. B. Durbin, 2006). در مقالهٔ Durbin در سال 2006 بازگشت، 4 مورد متمایز است. این گوناگونی، مقادیر محاسبه شده توسط ماتریس را تغییر نمیدهد، اما روش برگشت به عقب چندین مسیر مختلف در یک ساختار دوم ارائه میدهد که تمایز آنها از نظر معنایی مبهم است.
ارتباط بیولوژیکی
ساختار دومی که شامل ماکزیمم تعداد جفت بازهاست لزوماً آن ساختاری نیست که در طبیعت (در یک سلول) اتفاق بیفتد. بنابراین در عمل الگوریتم ناسینوف برای پیش گویی ساختار دوم توالیهای RNA به کار برده نمیشود. در عمل ساختار دوم پیش گویی شده تحت یک مدل ترمودینامیکی (برای مثال الگوریتم زوکر Zuker Algorithm را ببینید)است که منجر به نتایج معنادار بیولوژیکی میشود.با این حال الگوریتم ناسینوف از نظر تئوری در آموزش و پژوهش مورد توجه و علاقه است.برای مثال الگوریتم روش برگشت به عقب واترمن بایرز، Waterman-Byers-backtracking برای پیدا کردن زیرساختارهای بهینه به کار برده شد تا یک مثال از ماتریس برگشتی معین را توصیف کند. مطالعه الگوریتم آموزنده است، چرا که ، مانند الگوریتمهای دیگر پیشبینی ساختار RNA، از روش برنامهنویسی پویا استفاده میکند که دارای یک ماتریس بازگشتی است و به آسانی قابل درک است.
- Stefan Wuchty, Walter Fontana, Ivo L. Hofacker, Peter Schuster: Complete Suboptimal Folding of RNA and the Stability of Secondary Structures. In: Biopolymers. 49, 1999, S. 145-165PDF, 317 KB
الگو
- Ruth Nussinov and George Pieczenik and Jerrold R. Griggs and Daniel J. Kleitman: Algorithms for Loop Matchings. In: SIAM Journal on Applied Mathematics. 35, Nr. 1, Juli 1978, S. 68-82.
- Durbin et al.: Biological sequence analysis. Cambridge, 2006, ISBN 0-521-62971-3, S. 269-272.