Мы используем файлы cookie.
Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
بیوانفورماتیک

بیوانفورماتیک

Подписчиков: 0, рейтинг: 0
طرح کروموزوم اکس


زیست‌داده‌ورزی یا بیواَنفورماتیک (به فرانسوی: Bioinformatique) دانش استفاده از علوم رایانه و آمار و احتمالات در شاخه زیست‌شناسی مولکولی است. در چند دههٔ اخیر، پیشرفت در زیست‌شناسی مولکولی و تجهیزات مورد نیاز تحقیق در این زمینه باعث افزایش سریع تعیین توالی ژنوم و به دنبال آن ایجاد کلان داده‌ها (Big Data) بسیاری از گونه‌های موجودات شده‌است، تا جایی که پروژه‌های تعیین توالی ژنوم‌ها از پروژه‌های بسیار رایج این حوزه به حسب می‌آیند. امروزه توالی ژنوم بسیاری از موجودات ساده مانند باکتریها تا موجودات بسیار پیشرفته چون یوکاریوتهای پیچیده شناسایی شده‌است. پروژهٔ شناسایی ژنوم انسان در سال ۱۹۹۰ آغاز شد و در سال ۲۰۰۳ پایان یافت و اکنون اطلاعات کامل مربوط به توالی هر ۲۳ کروموزوم انسان موجود است.

بیوانفورماتیک یک دانش بین رشته‌ای است که شامل روش‌ها و نرم‌افزارهایی برای فهم اطلاعات زیستی است. بیوانفورماتیک به عنوان یک دانش بین رشته‌ای، به منظور تجزیه و تحلیل و تفسیر اطلاعات زیست‌شناسی، از ترکیب علوم رایانه، آمار، ریاضی و مهندسی استفاده می‌کند. به عبارتی دیگر از بیوانفورماتیک برای تجزیه و تحلیل درون رایانه‌ایِ مسائل زیست‌شناسی با استفاده از تکنیک‌های ریاضی و آمار استفاده می‌شود.

بیوانفورماتیک از برنامه‌ریزی‌های رایانه‌ای برای تجزیه و تحلیل اختصاصی ژنومیک استفاده می‌کند. از دیگر کاربردهای متداول بیوانفورماتیک، شناسایی چند شکلی‌های تک نوکلئوتیدی (SNPs) و ژن‌های کاندید است. چنین شناسایی‌هایی اغلب، با هدف فهم بهتر پایه ژنتیکی بیماری‌ها، تطابق و ایجاد خواص مطلوب (به‌ویژه در گونه‌های کشاورزی) یا شناخت تفاوت‌های میان جمعیت‌ها انجام می‌شود. بیوانفورماتیک همچنین به دنبال فهم بیشتری از اصول ساختاری نوکلئیک اسیدها و توالی پروتئین‌ها در غالب علم پروتومیک می‌باشد.

در زیست‌شناسی مولکولی تجربی، تکنیک‌های بیوانفورماتیک مانند پردازش سیگنال و تصویرسازی سه بعدی منجر می‌شود مقادیر بالایی از اطلاعات خام بدست بیاید. تفسیر این اطلاعات نتایج جالبی را به ما ارائه می‌کند. برای مثال در زمینه ژنتیک و ژنومیک، بیوانفورماتیک با طراحی پرایمر به تعیین توالی، تفسیر اطلاعات ژنومی و جهش‌های مشاهده شده در انسان کمک می‌کند. که این اطلاعات به تشخیص بیماری‌ها یا مداوای آنها کمک می‌کند.

بیوانفورماتیک همچنین نقش مهمی در تجزیه و تحلیل تنظیم و بیان ژن (Gene Expression) و پروتئین ایفا می‌کند. در حالت کلی بیوانفورماتیک به مقایسه ژنتیک و اطلاعات ژنومیک و به دنبال آن به فهم چگونگی تکامل زیست مولکولی کمک می‌کند. بیوانفورماتیک همچنین در شبیه‌سازی و مدلسازی رنا، دناو پروتئین‌ها و تعاملات زیست مولکولی کمک‌کننده است.

گسترش روزافزون حجم عظیم داده‌های ژنومی و نیاز به ذخیره، بازیابی و تحلیل مناسب این داده‌ها، موجب پیدایش علم بیوانفورماتیک گردید. این دانش نوظهور، به عنوان یک دانش بین رشته‌ای، تلاش می‌کند تا با استفاده از تکنیک‌های موجود در علوم رایانه، ریاضیات، ژنتیک، شیمی، فیزیک و علوم مرتبط دیگر، مسایل مختلف زیست‌شناختی را که معمولاً در سطح مولکولی هستند حل کند. تلاش‌های پژوهشی اصلی در این رشته عبارتند از: تطابق توالی، کشف ژن، گردآوری ژنوم، تنظیم ساختار پروتئینی، پیش‌بینی ساختارهای دوم و سوم پروتئین، پیش‌بینی بیان ژن و تعاملات پروتئین- پروتئین و مدلسازی تکامل.

واژه‌های بیوانفورماتیک و زیست‌شناسی محاسباتی اغلب به‌جای یکدیگر به‌کار می‌روند. به‌هرحال بیوانفورماتیک، به‌گونه مناسب‌تری به ایجاد و توسعه الگوریتمها، تکنیک‌های محاسباتی و آماری و تئوری اشاره می‌کند که برای حل مسایلی رسمی و عملی به‌کار می‌روند که توسط مدیریت و تحلیل داده‌های زیست‌شناختی مطرح شده یا از آن الهام می‌گیرند. از طرف دیگر زیست‌شناسی محاسباتی به تحقیق مبتنی بر فرضیه در مورد یک مسئله خاص زیست‌شناسی با استفاده از پردازش رایانه می‌پردازد که با داده‌های عملی و شبیه‌سازی شده انجام می‌شود و با هدف اصلی کشف و توسعه دانش زیست‌شناختی همراه است. تحقیق در زیست‌شناسی محاسباتی، با زیست‌شناسی سیستم‌ها هم‌پوشانی‌هایی دارد.

تمایز مشابهی توسط مؤسسه ملی سلامت آمریکا در کار بر روی تعریف بیوانفورماتیک و زیست‌شناسی محاسباتی انجام شده‌است که در آن تأکید بیشتر بر این است که پیوند محکمی از پیشرفت‌ها و دانش میان تحقیقات بیشتر مبتنی بر فرضیه زیست‌شناسی محاسباتی و پژوهش مبتنی بر تکنیک بیوانفورماتیک وجود دارد. همچنین زیست‌شناسی محاسباتی شامل دو زیرشاخه کمتر شناخته شده ولی به یک اندازه مهم است: بیوشیمی محاسباتی و بیوفیزیک محاسباتی.

یک خط مشترک در بیوانفورماتیک و زیست‌شناسی محاسباتی، استفاده از ابزارهای ریاضی و آماری برای استخراج اطلاعات مفید از داده‌های تولیدشده توسط تکنیک‌های زیست‌شناختی با برون‌ده بالا نظیر توالی ژنوم است. یک مسئله نمونه در بیوانفورماتیک، گردآوری توالی ژنوم با کیفیت بالا از یک توالی DNA تکه‌تکه شده تفنگ ساچمه‌ای(Shotgun sequencing) است. دیگر مسایل معمول عبارتند از مطالعه قواعد ژن با استفاده از داده‌هایی از ریزآرایه‌ها (Microarray) یا طیف‌سنجی جرمی (Mass Spectophotometry). داده‌های ریزآرایه در queryها ذخیره می شودو با مراجعه به کتابخانه‌ها می‌توان به آنها دسترسی پیدا کرد.

تاریخچه

از لحاظ تاریخی، اصطلاح بیوانفورماتیک به معنای امروزی آن نیست. پائولین هوگوگ و بن هسپر بیوانفورماتیک را در سال ۱۹۷۰ برای اشاره به مطالعه در زمینه پردازش اطلاعات و سیستم‌های زنده اختراع کردند). این تعریف از بیوانفورماتیک این علم را به عنوان یک حوزه در موازات با بیوفیزیک (مطالعه فرایندهای فیزیک در سیستم‌های زیستی) یا بیوشیمی (مطالعه فرایندهای شیمی در سیستم‌های زیستی) قرار می‌دهد.

پس از اینکه توالی انسولین در اوایل ۱۹۵۰ توسط فریدریک سانگر مشخص شد، وجود رایانه‌ها در زیست مولکولی ضرورت پیدا کرد. چرا که مقایسهٔ توالی‌های متعدد به صورت دستی طاقت فرسا بود. در این زمینه مارگارت دایهوف پیشگام شد و نخستین پایگاه داده توالی پروتئینی را گردآوری و به عنوان کتاب و روش‌های پیشگام در هم ترازی (alignment) توالی و ارزیابی مولکولی منتشر کرد. از جمله افراد دیگر در حوزه شکل‌گیری بیوانفورماتیک الوین کابات بود که در تجزیه و تحلیل توالی زیستی در سال ۱۹۷۰ پیشقدم شد.

اهداف

به منظور درک بهتر از چگونگی تغییر فعالیت‌های سلولی نرمال در بیماری‌های مختلف، باید اطلاعات زیستی ترکیب شوند تا تصویری جامع از این فعالیت‌ها شکل بگیرد. از اینرو بیوانفورماتیک در زمینه تجزیه و تحلیل و تفسیر انواع مختلفی از داده‌ها به کمک ما می‌آید. این داده‌ها شامل توالی نوکلئوتیدها و اسیدهای آمینه، دومین‌ها و ساختارهای پروتئینی است. فرایند تجزیه و تحلیل و تفسیر اطلاعات شامل: - توسعه و پیاده‌سازی برنامه‌های رایانه‌ای به منظور دسترسی کارآمد، استفاده و مدیریت از انواع مختلفی از اطلاعات - توسعهٔ الگوریتم‌های جدید (فرمول‌های ریاضی) و مقیاس‌های آماری به منظور ارزیابی ارتباطات میان اعضای مجموع داده‌های حجیم

به عنوان مثال می‌توان در شرایط رایانه‌ای، یک ژن را در داخل یک توالی خاص قرار داد و ساختار یا عملکرد پروتئین آن را پیش‌بینی کرد. هدف اولیه بیوانفورماتیک افزایش سطح فهم و درک از فرایندهای زیستی است و تمرکز آن در توسعه و کاربرد تکنیک‌های محاسباتی جامع به منظور کسب این هدف است برای مثال می‌توان به تشخیص الگو، داده کاوی، الگوریتم‌های یادگیری و تصویرسازی اشاره کرد. تلاش‌های تحقیقاتی گسترده‌ای در این زمینه (شامل هم ترازی توالی، ژن یابی، گردآوری ژنوم، طراحی و کشف دارو، پیش‌بینی ساختار پروتئین، پیش‌بینی بیان ژن، برهم کنش پروتئین-پروتئین، مطالعات مربوط به ژنوم، مدلسازی تکامل و تقسیم سلولی) در حال انجام است.

در چند دهه گذشته، پیشرفت سریع در علم ژنومیک و دیگر تکنیک‌های تحقیقات مولکولی با تکنیک‌های تجمیع اطلاعات (به منظور تولید مقادیر بسیار بالای از اطلاعات مرتبط با زیست مولکولی)، ترکیب شده‌اند.

فعالیت‌های متداول در بیوانفورماتیک شامل نقشه‌کشی و آنالیز توالی‌های DNA و پروتئین، هم ترازی توالی‌های DNA و پروتئین به منظور مقایسه آن‌ها و ایجاد مدل‌های سه بعدی از ساختارهای پروتئین است.

کاربردهای بیوانفورماتیک

-تجزیه و تحلیل توالی‌ها: از زمان توالی یابی فاژ Φ-X174در سال ۱۹۷۷ توالی DNA هزاران موجود تعیین و در پایگاه‌های داده ذخیره شد. این اطلاعات توالی به منظور تعیین ژن‌های کدکننده پروتئین، RNA، توالیهای تنظیمی، موتیف‌های ساختاری و توالی‌های تکرای تجزیه و تحلیل می‌شوند.

مقایسه ژنها درون و میان گونه‌ها می‌تواند شباهت میان عملکرد پروتئین‌ها یا ارتباطات میان گونه‌ها (درخت فیلوژنیک) را نشان دهد. امروزه برنامه‌های رایانه‌ای مانند BLAST به صورت روزمره برای جستجوی توالی بیشتر از ۲۶۰۰۰۰ موجود زنده شامل بیشتر از ۱۹۰ میلیارد نوکلئوتید استفاده می‌شود. آنالیز توالی در بیوانفورماتیک برای توالی یابی، گردآوری ژنوم، تفسیر ژنوم و موارد دیگر به کار می‌رود. -تجزیه و تحلیل ساختار سلولی: روش‌های متعددی برای تجزیه و تحلیل موقعیت اندامک‌ها، پروتئین‌ها و دیگر اجزا داخل سلولی ایجاد شده‌اند. این روش‌ها به ما کمک می‌کند تا بتوانیم رفتارهای سیستم‌های زیستی را به درستی پیش‌بینی کنیم.

-بیوانفورماتیک ساختاری (Structural Bioinformatics): پیش‌بینی ساختار پروتئین یکی دیگر از کاربردهای بیوانفورماتیک است. توالی اسیدآمینه‌ای پروتئین که ساختار اولیه نامیده می‌شود می‌تواند به راحتی توسط توالی ژن رمزکننده اش تعیین شود. شناخت ساختار اولیه در فهم عملکرد پروتئین حیاتی است. بیوانفورماتیک می-تواند ساختار یک پروتئین را از طریق بررسی شباهت بین ژن رمزکنندهٔ پروتئین و ژنی که عملکرد آن مشخص شده‌است پیش‌بینی کند.

از مهمترین کارها در بیوانفورماتیک تجزیه و تحلیل اطلاعات توالی است. زیست‌شناسی محاسباتی نامی است که به این فرایند داده شده‌است و شامل موارد زیر است:

  • پیدا کردن ژن‌ها در توالی‌های دی ان ای
  • توسعهٔ روش‌های پیش‌بینی ساختار یا وظایف پروتئینهای تازه کشف شده و توالی‌های ساختاری RNA
  • صف بندی پروتئین‌های مشابه و ایجاد درخت‌های نژادشناسی برای بررسی روابط تکاملی.

دو فعالیت برجسته در بیوانفورماتیک، پروتئومیک و ژنومیک هستند. از شاخه‌های دیگر علوم زیستی همچون متابولیک و ترانسکریپتومیک نیز استفاده می‌شود. لازم است ذکر شود سه بانک DDBJ در ژاپن و EBI در اروپا و NCBI در آمریکا روزانه تمام اطلاعات ژنتیکی که به هر کدام از این سه بانک ارسال می‌شود را در بین هم به اشتراک می‌گذراند. این سه بانک به علت ارائه ابزارهای جانبی می‌توانند کاربردهای متفاوتی داشته باشند. سایت پیش تاز در بین این سه سایت در ارائه نرم‌افزارها و بانک‌های کاربردی NCBI می‌باشد.

زمینه‌های مهم بیوانفورماتیک

۱. تحلیل توالی‌های ژنوم(Genomics Data Analysis)

در این زمینه بررسی می‌شود که آیا یک توالی به دست آمده برای یک DNA در برگیرندهٔ یک ژن هست یا خیر. اگر وجود دارد در کجای زنجیرهٔ DNA قرار دارد و آنزیمی که کد می‌کند چه نقشی در سلول یا فرایندهای حیاتی ایفا می‌کند.

۲. پیش‌بینی ساختار سه بعدی پروتئین(3D Structure Prediction)

کاربرد مولکول‌های بزرگ پروتئین بستگی زیادی به شکل فضایی و ساختار سه بعدی آن‌ها دارد. ژن‌ها با عملکرد پروتئین‌هایی که می‌سازند نقش خود را اعمال می‌کنند؛ بنابراین لازمهٔ شناخت کامل ژن‌ها، شناخت کامل پروتئین‌ها است.
پیشرفت پروژه‌های پروتیوم به دلایل زیر کند است:
  • هزینهٔ زیاد
  • کندی روند تعیین توالی پروتئین‌ها
  • مشکل بودن تعیین ساختار سه بعدی پروتئین‌ها در آزمایشگاه

دو اصل مهم برای تعیین ساختار سه بعدی پروتئین از روی توالی آن وجود دارد که هر کدام روش جداگانه‌ای ارائه می‌دهند:

  • پروتئین‌ها با توالی نسبتاً مشابه، شکل فضایی شبیه به هم پیدا می‌کنند. (جستجو برای یافتن توالی‌های مشابه)
  • شکل فضایی مولکول به گونه‌ای است که به حداقل سطح انرژی برسد (استفاده از قوانین شیمی، فیزیک و ترمودینامیک)

۳. تحلیل کارکردی در سطح ژنوم

با به‌کارگیری روش‌های آماری پیشرفته و کلاستربندی، مسائلی چون بررسی هم‌زمان میزان فعالیت هزاران ژن در سلول، تحلیل نحوه تعامل تعداد زیادی پروتئین و تحلیل خصوصیات هزاران سلول جهش یافته در آن واحد حل شده‌اند. دانش مربوط به این بخش ژنوم‌شناسی کارکردی نام دارد و از دستاوردهای مهم در این زمینه می‌توان پیش‌بینی نقش و کارکرد ژن‌ها در سلول بدون نیاز به آنالیز داده‌های پروتئینی را نام برد.

۴. ایجاد و مدیریت پایگاه‌های داده‌ای

داده‌های تولید شده در زیست‌شناسی مولکولی باید از طریق پایگاه در اختیار پژوهشگران قرار گیرد. نحوهٔ حصول اطمینان از صحت داده‌ها و چگونگی نمایش مفید داده‌ها از دغدغه‌های اداره کنندگان پایگاه‌های بزرگ بیوانفورماتیکی هستند.

۵. مدل‌سازی ریاضی و فرایندهای حیات

یکی از اهداف مهم بیوانفورماتیک درک کامل سازوکار ارگانیسم‌های زنده در سطح مولکولی است. برای تحقق این هدف، تلاش می‌کنند فرایندهای خاص سلولی را شبیه‌سازی کرده و با یک پارچه‌سازی آن‌ها به یک سلول کامل برسند.
توالی ژن‌ها و پروتئین‌های مختلف ممکن است پهلو به پهلو برای اندازه‌گیری شباهت‌هایشان هم تراز شوند. این ترازبندی توالی پروتئین حاوی دومین‌های WPP را مقایسه می‌کند.

موضوعات سیستم نرم‌افزاری بیوانفورماتیک

  1. ماهیت اطلاعات و داده‌های زیستی
  2. ذخیره‌سازی اطلاعات، تجزیه و تحلیل و بازیابی
  3. محاسبه، مدل‌سازی و شبیه‌سازی
  4. بیولوژی با معنی اطلاعات و یکپارچگی آنها
  5. کندوکاو در داده‌ها
  6. مجسم کردن پردازش و تجسم فکری آن
  7. خاتمهٔ این چرخه

مراکز و ابزار

جستارهای وابسته

پیوند به بیرون

Baldi P. and Brunak S. (2001), Bioinformatics: The Machine Learning Approach, 2nd edition. MIT Press.

Barnes, M.R. and Gray I.C. (2003), Bioinformatics for Geneticists, first edition. Wiley.

Baxevanis, A.D. and Ouellette, B.F.F. , eds. , Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, third edition. Wiley, 2005.

Claverie, J.M. and C. Notredame (2003), Bioinformatics for Dummies. Wiley.

Durbin, R. , S. Eddy, A. Krogh and G. Mitchison (1998), Biological sequence analysis.

Cambridge University Press.


Новое сообщение