Продолжая использовать сайт, вы даете свое согласие на работу с этими файлами.
- پروژه ۱۰۰۰ ژنوم
- بانک اطلاعات پزشکی (Biobank)
- زیستتراشه
- آنالیز تصاویر زیستی
- بیوانفورماتیک
- پایگاهداده زیستشناختی
- دیداریسازی داده زیستی
- شبکههای زیستی
- استنباط شبکههای زیستی
- زیستتقلید
- بیوپانک
- آمار زیستی
- فیلتر بلوم در بیوانفورماتیک
- شبکه بولی
- نگاشت مغزی
- روش چو-فسمن
- زیستشناسی محاسباتی
- اپیژنتیک محاسباتی
- ژنومیک محاسباتی
- ایمنیشناسی محاسباتی
- توالی اجماع
- همگذاری ازسرنو ترانسکریپتوم
- ماتریس فاصله
- جدول کدون دیانای
- محل اتصال دیانای
- ریزآرایه دیانای
- خطای خوانش دیانای
- نظریه توالییابی دیانای
- داکینگ (مدلسازی)
- رسم نقطهای
- پروژه پایگاه داده ژنوم آنسامبل
- عدد گروه آنزیم
- رایانش فرگشتی
- اکسپسی
- قالب فستا
- قالب فستک
- فولدینگ ات هم
- مدل بنیادین کالبدشناسی
- ژنبانک
- شبکه همبیانی ژنها
- ژنیابی
- نقشه گرمایی
- مدل مارکوف پنهان
- پروژه ژنوم انسان
- پروژه میکروبیوم انسان
- انفورماتیک تصویری
- اینترکتوم
- ک تایی
- یادگیری ماشین در بیوانفورماتیک
- داکینگ ماکرومولکولی
- متابولوم
- متاژنومیک
- مدلسازی سیستمهای زیستی
- مدلهای سیر فرگشتی دیانای
- مدلسازی مولکولی
- ایام چندگانه برای استخراج موتیف
- همترازسازی چندتوالی
- نوروانفورماتیک
- چارچوب خوانش باز
- ساختار اولیه پروتئین
- پیفم
- تبارزایی
- جستجوی موتیف گماشتهشده
- جهش پذیرفته نقطهای
- ماتریس وزن موقعیت خاص
- دقت و بازیابی
- گرامر مستقل از متن تصادفی
- بانک داده پروتئین
- خانواده پروتئین
- پیشبینی عملکرد پروتئین
- پیشبینی ساختار پروتئین
- پروتئین دیانای پیوست
- حساسیت و ویژگی
- آنالیز دنباله
- بازسازی توالی
- دنباله گرافی
- دنباله موتیف
- دنبالهکاوی
- توالییابی شاتگان
- حاشیهنویسی اسنیپ
- بیوانفورماتیک ساختاری
- ژنومیک ساختاری
- ماتریس جایگزینی
- مدل جایگزینی
- زیستشناسی مصنوعی
- زیستشناسی سامانهها
- سامانه جستجوی بانک ژنی دانشگاه کالیفرنیا، سانتا کروز
- یونیپروت
- توالییابی کل ژنوم
- زنوبیولوژی
بیوانفورماتیک
بخشی از مجموعه مباحث دربارهٔ |
بیوشیمی |
---|
مفاهیم کلیدی
|
فهرست بیوشیمیدانان
|
واژهنامه
|
زیستدادهورزی یا بیواَنفورماتیک (به فرانسوی: Bioinformatique) دانش استفاده از علوم رایانه و آمار و احتمالات در شاخه زیستشناسی مولکولی است. در چند دههٔ اخیر، پیشرفت در زیستشناسی مولکولی و تجهیزات مورد نیاز تحقیق در این زمینه باعث افزایش سریع تعیین توالی ژنوم و به دنبال آن ایجاد کلان دادهها (Big Data) بسیاری از گونههای موجودات شدهاست، تا جایی که پروژههای تعیین توالی ژنومها از پروژههای بسیار رایج این حوزه به حسب میآیند. امروزه توالی ژنوم بسیاری از موجودات ساده مانند باکتریها تا موجودات بسیار پیشرفته چون یوکاریوتهای پیچیده شناسایی شدهاست. پروژهٔ شناسایی ژنوم انسان در سال ۱۹۹۰ آغاز شد و در سال ۲۰۰۳ پایان یافت و اکنون اطلاعات کامل مربوط به توالی
هر ۲۳ کروموزوم انسان موجود است.
بیوانفورماتیک یک دانش بین رشتهای است که شامل روشها و نرمافزارهایی برای فهم اطلاعات زیستی است. بیوانفورماتیک به عنوان یک دانش بین رشتهای، به منظور تجزیه و تحلیل و تفسیر اطلاعات زیستشناسی، از ترکیب علوم رایانه، آمار، ریاضی و مهندسی استفاده میکند. به عبارتی دیگر از بیوانفورماتیک برای تجزیه و تحلیل درون رایانهایِ مسائل زیستشناسی با استفاده از تکنیکهای ریاضی و آمار استفاده میشود.
بیوانفورماتیک از برنامهریزیهای رایانهای برای تجزیه و تحلیل اختصاصی ژنومیک استفاده میکند. از دیگر کاربردهای متداول بیوانفورماتیک، شناسایی چند شکلیهای تک نوکلئوتیدی (SNPs) و ژنهای کاندید است. چنین شناساییهایی اغلب، با هدف فهم بهتر پایه ژنتیکی بیماریها، تطابق و ایجاد خواص مطلوب (بهویژه در گونههای کشاورزی) یا شناخت تفاوتهای میان جمعیتها انجام میشود. بیوانفورماتیک همچنین به دنبال فهم بیشتری از اصول ساختاری نوکلئیک اسیدها و توالی پروتئینها در غالب علم پروتومیک میباشد.
در زیستشناسی مولکولی تجربی، تکنیکهای بیوانفورماتیک مانند پردازش سیگنال و تصویرسازی سه بعدی منجر میشود مقادیر بالایی از اطلاعات خام بدست بیاید. تفسیر این اطلاعات نتایج جالبی را به ما ارائه میکند. برای مثال در زمینه ژنتیک و ژنومیک، بیوانفورماتیک با طراحی پرایمر به تعیین توالی، تفسیر اطلاعات ژنومی و جهشهای مشاهده شده در انسان کمک میکند. که این اطلاعات به تشخیص بیماریها یا مداوای آنها کمک میکند.
بیوانفورماتیک همچنین نقش مهمی در تجزیه و تحلیل تنظیم و بیان ژن (Gene Expression) و پروتئین ایفا میکند. در حالت کلی بیوانفورماتیک به مقایسه ژنتیک و اطلاعات ژنومیک و به دنبال آن به فهم چگونگی تکامل زیست مولکولی کمک میکند. بیوانفورماتیک همچنین در شبیهسازی و مدلسازی رنا، دناو پروتئینها و تعاملات زیست مولکولی کمککننده است.
گسترش روزافزون حجم عظیم دادههای ژنومی و نیاز به ذخیره، بازیابی و تحلیل مناسب این دادهها، موجب پیدایش علم بیوانفورماتیک گردید. این دانش نوظهور، به عنوان یک دانش بین رشتهای، تلاش میکند تا با استفاده از تکنیکهای موجود در علوم رایانه، ریاضیات، ژنتیک، شیمی، فیزیک و علوم مرتبط دیگر، مسایل مختلف زیستشناختی را که معمولاً در سطح مولکولی هستند حل کند. تلاشهای پژوهشی اصلی در این رشته عبارتند از: تطابق توالی، کشف ژن، گردآوری ژنوم، تنظیم ساختار پروتئینی، پیشبینی ساختارهای دوم و سوم پروتئین، پیشبینی بیان ژن و تعاملات پروتئین- پروتئین و مدلسازی تکامل.
واژههای بیوانفورماتیک و زیستشناسی محاسباتی اغلب بهجای یکدیگر بهکار میروند. بههرحال بیوانفورماتیک، بهگونه مناسبتری به ایجاد و توسعه الگوریتمها، تکنیکهای محاسباتی و آماری و تئوری اشاره میکند که برای حل مسایلی رسمی و عملی بهکار میروند که توسط مدیریت و تحلیل دادههای زیستشناختی مطرح شده یا از آن الهام میگیرند. از طرف دیگر زیستشناسی محاسباتی به تحقیق مبتنی بر فرضیه در مورد یک مسئله خاص زیستشناسی با استفاده از پردازش رایانه میپردازد که با دادههای عملی و شبیهسازی شده انجام میشود و با هدف اصلی کشف و توسعه دانش زیستشناختی همراه است. تحقیق در زیستشناسی محاسباتی، با زیستشناسی سیستمها همپوشانیهایی دارد.
تمایز مشابهی توسط مؤسسه ملی سلامت آمریکا در کار بر روی تعریف بیوانفورماتیک و زیستشناسی محاسباتی انجام شدهاست که در آن تأکید بیشتر بر این است که پیوند محکمی از پیشرفتها و دانش میان تحقیقات بیشتر مبتنی بر فرضیه زیستشناسی محاسباتی و پژوهش مبتنی بر تکنیک بیوانفورماتیک وجود دارد. همچنین زیستشناسی محاسباتی شامل دو زیرشاخه کمتر شناخته شده ولی به یک اندازه مهم است: بیوشیمی محاسباتی و بیوفیزیک محاسباتی.
یک خط مشترک در بیوانفورماتیک و زیستشناسی محاسباتی، استفاده از ابزارهای ریاضی و آماری برای استخراج اطلاعات مفید از دادههای تولیدشده توسط تکنیکهای زیستشناختی با برونده بالا نظیر توالی ژنوم است. یک مسئله نمونه در بیوانفورماتیک، گردآوری توالی ژنوم با کیفیت بالا از یک توالی DNA تکهتکه شده تفنگ ساچمهای(Shotgun sequencing) است. دیگر مسایل معمول عبارتند از مطالعه قواعد ژن با استفاده از دادههایی از ریزآرایهها (Microarray) یا طیفسنجی جرمی (Mass Spectophotometry). دادههای ریزآرایه در queryها ذخیره می شودو با مراجعه به کتابخانهها میتوان به آنها دسترسی پیدا کرد.
تاریخچه
از لحاظ تاریخی، اصطلاح بیوانفورماتیک به معنای امروزی آن نیست. پائولین هوگوگ و بن هسپر بیوانفورماتیک را در سال ۱۹۷۰ برای اشاره به مطالعه در زمینه پردازش اطلاعات و سیستمهای زنده اختراع کردند). این تعریف از بیوانفورماتیک این علم را به عنوان یک حوزه در موازات با بیوفیزیک (مطالعه فرایندهای فیزیک در سیستمهای زیستی) یا بیوشیمی (مطالعه فرایندهای شیمی در سیستمهای زیستی) قرار میدهد.
پس از اینکه توالی انسولین در اوایل ۱۹۵۰ توسط فریدریک سانگر مشخص شد، وجود رایانهها در زیست مولکولی ضرورت پیدا کرد. چرا که مقایسهٔ توالیهای متعدد به صورت دستی طاقت فرسا بود. در این زمینه مارگارت دایهوف پیشگام شد و نخستین پایگاه داده توالی پروتئینی را گردآوری و به عنوان کتاب و روشهای پیشگام در هم ترازی (alignment) توالی و ارزیابی مولکولی منتشر کرد. از جمله افراد دیگر در حوزه شکلگیری بیوانفورماتیک الوین کابات بود که در تجزیه و تحلیل توالی زیستی در سال ۱۹۷۰ پیشقدم شد.
اهداف
به منظور درک بهتر از چگونگی تغییر فعالیتهای سلولی نرمال در بیماریهای مختلف، باید اطلاعات زیستی ترکیب شوند تا تصویری جامع از این فعالیتها شکل بگیرد. از اینرو بیوانفورماتیک در زمینه تجزیه و تحلیل و تفسیر انواع مختلفی از دادهها به کمک ما میآید. این دادهها شامل توالی نوکلئوتیدها و اسیدهای آمینه، دومینها و ساختارهای پروتئینی است. فرایند تجزیه و تحلیل و تفسیر اطلاعات شامل: - توسعه و پیادهسازی برنامههای رایانهای به منظور دسترسی کارآمد، استفاده و مدیریت از انواع مختلفی از اطلاعات - توسعهٔ الگوریتمهای جدید (فرمولهای ریاضی) و مقیاسهای آماری به منظور ارزیابی ارتباطات میان اعضای مجموع دادههای حجیم
به عنوان مثال میتوان در شرایط رایانهای، یک ژن را در داخل یک توالی خاص قرار داد و ساختار یا عملکرد پروتئین آن را پیشبینی کرد. هدف اولیه بیوانفورماتیک افزایش سطح فهم و درک از فرایندهای زیستی است و تمرکز آن در توسعه و کاربرد تکنیکهای محاسباتی جامع به منظور کسب این هدف است برای مثال میتوان به تشخیص الگو، داده کاوی، الگوریتمهای یادگیری و تصویرسازی اشاره کرد. تلاشهای تحقیقاتی گستردهای در این زمینه (شامل هم ترازی توالی، ژن یابی، گردآوری ژنوم، طراحی و کشف دارو، پیشبینی ساختار پروتئین، پیشبینی بیان ژن، برهم کنش پروتئین-پروتئین، مطالعات مربوط به ژنوم، مدلسازی تکامل و تقسیم سلولی) در حال انجام است.
در چند دهه گذشته، پیشرفت سریع در علم ژنومیک و دیگر تکنیکهای تحقیقات مولکولی با تکنیکهای تجمیع اطلاعات (به منظور تولید مقادیر بسیار بالای از اطلاعات مرتبط با زیست مولکولی)، ترکیب شدهاند.
فعالیتهای متداول در بیوانفورماتیک شامل نقشهکشی و آنالیز توالیهای DNA و پروتئین، هم ترازی توالیهای DNA و پروتئین به منظور مقایسه آنها و ایجاد مدلهای سه بعدی از ساختارهای پروتئین است.
کاربردهای بیوانفورماتیک
-تجزیه و تحلیل توالیها: از زمان توالی یابی فاژ Φ-X174در سال ۱۹۷۷ توالی DNA هزاران موجود تعیین و در پایگاههای داده ذخیره شد. این اطلاعات توالی به منظور تعیین ژنهای کدکننده پروتئین، RNA، توالیهای تنظیمی، موتیفهای ساختاری و توالیهای تکرای تجزیه و تحلیل میشوند.
مقایسه ژنها درون و میان گونهها میتواند شباهت میان عملکرد پروتئینها یا ارتباطات میان گونهها (درخت فیلوژنیک) را نشان دهد. امروزه برنامههای رایانهای مانند BLAST به صورت روزمره برای جستجوی توالی بیشتر از ۲۶۰۰۰۰ موجود زنده شامل بیشتر از ۱۹۰ میلیارد نوکلئوتید استفاده میشود. آنالیز توالی در بیوانفورماتیک برای توالی یابی، گردآوری ژنوم، تفسیر ژنوم و موارد دیگر به کار میرود. -تجزیه و تحلیل ساختار سلولی: روشهای متعددی برای تجزیه و تحلیل موقعیت اندامکها، پروتئینها و دیگر اجزا داخل سلولی ایجاد شدهاند. این روشها به ما کمک میکند تا بتوانیم رفتارهای سیستمهای زیستی را به درستی پیشبینی کنیم.
-بیوانفورماتیک ساختاری (Structural Bioinformatics): پیشبینی ساختار پروتئین یکی دیگر از کاربردهای بیوانفورماتیک است. توالی اسیدآمینهای پروتئین که ساختار اولیه نامیده میشود میتواند به راحتی توسط توالی ژن رمزکننده اش تعیین شود. شناخت ساختار اولیه در فهم عملکرد پروتئین حیاتی است. بیوانفورماتیک می-تواند ساختار یک پروتئین را از طریق بررسی شباهت بین ژن رمزکنندهٔ پروتئین و ژنی که عملکرد آن مشخص شدهاست پیشبینی کند.
از مهمترین کارها در بیوانفورماتیک تجزیه و تحلیل اطلاعات توالی است. زیستشناسی محاسباتی نامی است که به این فرایند داده شدهاست و شامل موارد زیر است:
- پیدا کردن ژنها در توالیهای دی ان ای
- توسعهٔ روشهای پیشبینی ساختار یا وظایف پروتئینهای تازه کشف شده و توالیهای ساختاری RNA
- صف بندی پروتئینهای مشابه و ایجاد درختهای نژادشناسی برای بررسی روابط تکاملی.
دو فعالیت برجسته در بیوانفورماتیک، پروتئومیک و ژنومیک هستند. از شاخههای دیگر علوم زیستی همچون متابولیک و ترانسکریپتومیک نیز استفاده میشود. لازم است ذکر شود سه بانک DDBJ در ژاپن و EBI در اروپا و NCBI در آمریکا روزانه تمام اطلاعات ژنتیکی که به هر کدام از این سه بانک ارسال میشود را در بین هم به اشتراک میگذراند. این سه بانک به علت ارائه ابزارهای جانبی میتوانند کاربردهای متفاوتی داشته باشند. سایت پیش تاز در بین این سه سایت در ارائه نرمافزارها و بانکهای کاربردی NCBI میباشد.
زمینههای مهم بیوانفورماتیک
۱. تحلیل توالیهای ژنوم(Genomics Data Analysis)
- در این زمینه بررسی میشود که آیا یک توالی به دست آمده برای یک DNA در برگیرندهٔ یک ژن هست یا خیر. اگر وجود دارد در کجای زنجیرهٔ DNA قرار دارد و آنزیمی که کد میکند چه نقشی در سلول یا فرایندهای حیاتی ایفا میکند.
۲. پیشبینی ساختار سه بعدی پروتئین(3D Structure Prediction)
- کاربرد مولکولهای بزرگ پروتئین بستگی زیادی به شکل فضایی و ساختار سه بعدی آنها دارد. ژنها با عملکرد پروتئینهایی که میسازند نقش خود را اعمال میکنند؛ بنابراین لازمهٔ شناخت کامل ژنها، شناخت کامل پروتئینها است.
- پیشرفت پروژههای پروتیوم به دلایل زیر کند است:
- هزینهٔ زیاد
- کندی روند تعیین توالی پروتئینها
- مشکل بودن تعیین ساختار سه بعدی پروتئینها در آزمایشگاه
دو اصل مهم برای تعیین ساختار سه بعدی پروتئین از روی توالی آن وجود دارد که هر کدام روش جداگانهای ارائه میدهند:
- پروتئینها با توالی نسبتاً مشابه، شکل فضایی شبیه به هم پیدا میکنند. (جستجو برای یافتن توالیهای مشابه)
- شکل فضایی مولکول به گونهای است که به حداقل سطح انرژی برسد (استفاده از قوانین شیمی، فیزیک و ترمودینامیک)
۳. تحلیل کارکردی در سطح ژنوم
- با بهکارگیری روشهای آماری پیشرفته و کلاستربندی، مسائلی چون بررسی همزمان میزان فعالیت هزاران ژن در سلول، تحلیل نحوه تعامل تعداد زیادی پروتئین و تحلیل خصوصیات هزاران سلول جهش یافته در آن واحد حل شدهاند. دانش مربوط به این بخش ژنومشناسی کارکردی نام دارد و از دستاوردهای مهم در این زمینه میتوان پیشبینی نقش و کارکرد ژنها در سلول بدون نیاز به آنالیز دادههای پروتئینی را نام برد.
۴. ایجاد و مدیریت پایگاههای دادهای
- دادههای تولید شده در زیستشناسی مولکولی باید از طریق پایگاه در اختیار پژوهشگران قرار گیرد. نحوهٔ حصول اطمینان از صحت دادهها و چگونگی نمایش مفید دادهها از دغدغههای اداره کنندگان پایگاههای بزرگ بیوانفورماتیکی هستند.
۵. مدلسازی ریاضی و فرایندهای حیات
- یکی از اهداف مهم بیوانفورماتیک درک کامل سازوکار ارگانیسمهای زنده در سطح مولکولی است. برای تحقق این هدف، تلاش میکنند فرایندهای خاص سلولی را شبیهسازی کرده و با یک پارچهسازی آنها به یک سلول کامل برسند.
موضوعات سیستم نرمافزاری بیوانفورماتیک
- ماهیت اطلاعات و دادههای زیستی
- ذخیرهسازی اطلاعات، تجزیه و تحلیل و بازیابی
- محاسبه، مدلسازی و شبیهسازی
- بیولوژی با معنی اطلاعات و یکپارچگی آنها
- کندوکاو در دادهها
- مجسم کردن پردازش و تجسم فکری آن
- خاتمهٔ این چرخه
مراکز و ابزار
جستارهای وابسته
- علم دادهها
- زیستشناسی سلولی
- زیستشناسی ملکولی
- ژنتیک مولکولی
- تمایز سلولی
- رویانشناسی
- زیست فناوری
- مهندسی ژنتیک
- مهندسی پروتئین
- نانوبیوتکنولوژی
- میکروبیولوژی
- زیسترایانه
پیوند به بیرون
- انجمن بیوانفورماتیک ایران
- مرکز بیوانفورماتیک دانشگاه تهران
- مرکز ملی تحقیقات بیوانفورماتیک
- انستیتو بیو-آیتی بایگانیشده در ۲۹ اوت ۲۰۱۷ توسط Wayback Machine
- بانک دادههای دی ان ای، کشور ژاپن
- مرکز ملی اطلاعات بیوتکنولوژی، کشور آمریکا
- انستیتوی بیوانفورماتیک اروپا، اروپا
- پورتال بیوانفورماتیک ایران
Baldi P. and Brunak S. (2001), Bioinformatics: The Machine Learning Approach, 2nd edition. MIT Press.
Barnes, M.R. and Gray I.C. (2003), Bioinformatics for Geneticists, first edition. Wiley.
Baxevanis, A.D. and Ouellette, B.F.F. , eds. , Bioinformatics: A Practical Guide to the Analysis of Genes and Proteins, third edition. Wiley, 2005.
Claverie, J.M. and C. Notredame (2003), Bioinformatics for Dummies. Wiley.
Durbin, R. , S. Eddy, A. Krogh and G. Mitchison (1998), Biological sequence analysis.
Cambridge University Press.
Note: This template roughly follows the 2012 ACM Computing Classification System. | |
سختافزار | |
سازمان سامانههای رایانه |
|
شبکه رایانهای | |
سازمان نرمافزار | |
نظریه زبانهای برنامهنویسی و ابزار توسعه نرمافزار |
|
توسعه نرمافزار | |
نظریه محاسبات | |
الگوریتمها | |
ریاضیات رایانه |
|
سامانه اطلاعاتی | |
امنیت رایانه | |
تعامل انسان و رایانه | |
همروندی | |
هوش مصنوعی | |
یادگیری ماشین | |
گرافیک رایانهای | |
رایانش کاربردی |
|
توجه: بنا بر سامانه ردهبندی رایانش ایسیام علم رایانه همچنین میتواند به موضوعها یا زمینههای گوناگون تقسیم شود.
|
زمینهها |
|
||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
اجزا | |||||||||||||||||||||||||
تاریخ فناوری | |||||||||||||||||||||||||
Theories و ایدهها |
|
||||||||||||||||||||||||
سایر |
|
||||||||||||||||||||||||
| |||||||||||||||||||||
| |||||||||||||||||||||
| |||||||||||||||||||||
| |||||||||||||||||||||
| |||||||||||||||||||||
| |||||||||||||||||||||
مدیریت اطلاعات سلامت | |
---|---|
رشتههای فرعی | |
طبقهبندی پزشکی | |
سازمانهای حرفهای | |
دیگر مفاهیم |
|
آزمایش |
|
---|---|
بیوانفورماتیک | |
سنجش | |
روشهای نمایش | |
Super-resolution microscopy |
سلسلهمراتب زیستی |
|
||||||||
---|---|---|---|---|---|---|---|---|---|
بنیانها | |||||||||
اصول |
|
||||||||
زیرشاخهها |
|
||||||||
واژهنامهها | |||||||||