ذخیره سازی داده ها – دیتا استریپینگ (موازی سازی ورودی و خروجی)

  1. معرفی

منظور از تکنیک دیتا استریپینگ در ذخیره سازی داده های یک کامپیوتر، تقسیم بندی منطقی داده های ترتیبی مانند یک فایل است؛ به صورتی که دسترسی به بخش های متوالی از طریق دستگاه های ذخیره سازی فیزیکی مختلفی انجام می شود.

با دادن دسترسی هر بخش به چندین دستگاه (مانند هارد درایو) ، می توان به طور همزمان یا به اصطلاح موازی به چندین بخش متصل شده و در نتیجه توان دسترسی به داده ها را افزایش داد. به علاوه با این تکنیک زمان انتظار پردازنده برای دسترسی به داده ها کاهش می یابد.

ذخیره سازی داده ها - دیتا استریپینگ

استفاده از دیتا استریپینگ نرخ انتقال بالایی برای ورودی I/O های گسترده ارائه می دهد که چندین برابر بیشتر از نرخ انتقال یک هارد درایو بسیار سریع می باشد. اولین کاربرد این فناوری در یک آرایه Redundant از ذخیره سازی دیسک های مستقل یا RAID بوده است.

در همین جهت Oracle سالهاست که به کاربران خود توصیه می کند روش Stripe And Mirror Everything یا همان S.A.M.E. را از طریق یک اندازه نوار 1 مگابایتی استفاده کنند. تنظیم چنین پیکربندی نسبتاً ساده بوده و در عین حال عملکرد خوبی را برای هر نوع فعالیتی (OLTP ، گزارش و انبار داده ها) ارائه می دهد.

  1. مزایا و معایب

مزایا: توان عملیاتی بالاتر

از مزایای دیتا استریپینگ می توان به عملکرد از طریق توان عملیاتی بالاتر اشاره کرد. به این صورت که ترکیب متوالی دسترسی های داده، باعث می شود تا ضریب دسترسی به داده های هر دستگاه ذخیره سازی به طور تجمعی افزایش یابد.

معایب: درصد خرابی بالا

از آنجا که در این روش بخش های مختلف داده در دستگاه های ذخیره سازی مختلفی نگهداری می شود، خرابی یک دستگاه باعث خراب شدن توالی کامل داده ها می شود. به عبارتی میزان خرابی آرایه دستگاه های ذخیره سازی برابر است با مجموع میزان خرابی هر دستگاه ذخیره سازی.

البته با ذخیره سازی یکسری اطلاعات اضافی مانند بیت توازن یاparity ، می توان بر این عیب دیتا استریپینگ غلبه کرد. در چنین سیستمی با صرف هزینه برای ذخیره سازی اضافی، می توان از ضرر های احتمالی جلوگیری کرد.

ذخیره سازی داده ها - دیتا استریپینگ

  1. مراحل استریپینگ

استریپینگ در دو سطح استفاده می شود: سخت افزار و نرم افزار

سخت افزار

  • در سراسر درایوهای دیسک حافظه RAID
  • رابط های شبکه در حافظه Grid-oriented یا شبکه گرا
  • در قسمت رم برخی از سیستم ها

نرم افزار

برخی از پایگاه داده های مدرن مانند Sybase

فایل های خوشه‌ای سیستم: مدیریت ذخیره سازی خودکار Oracle به فایل های ASM اجازه می دهد تا به شکل انواع داده های استریپینگ در دسترس باشند.

مدیریت حجم منطقی یا LVM : ابزارهای LVM امکان پیاده سازی داده ها را به همراه میرورینگ امکان پذیر می سازند. این قابلیت را می توان با استفاده از متادیتا فرمت LVM2 بدست آورد.

استریپینگ سخت افزار یا نرم افزار؟

در صورت استریپینگ سخت افزار، محاسبات لازم سیستم توسط کنترل کننده و همراه با استریپینگ نرم افزار در پردازنده سرور انجام می شود.

بنابراین اگر محاسبات استریپینگ شده بسیار ساده بوده (مانند RAID 1 یا  10RAID) و سرور نسبتاً قدرتمند باشد، استفاده از استریپینگ نرم افزار مناسب بوده و مشکل چندانی وجود نخواهد داشت.

اما برای محاسبات پیچیده‌تر (مانند RAID 5EE یا RAID 6)، پیشنهاد می کنیم از استریپینگ سخت افزار استفاده کنید؛ زیرا با این کار عملکرد سیستم و برنامه های موجود در سرور به دلیل حجم کاری سرور به خطر نمی افتند.

به علاوه در صورت استفاده از استریپینگ سخت افزار، قابلیت استریپینگ از سیستم عامل مستقل شده و درایورهای ساده HBA که برای یک کنترل کننده مورد نیاز هستند؛ معمولاً به عنوان بخشی از توزیع سیستم عامل در دسترس قرار می گیرند. همچنین با وجود باتری، استریپینگ سخت افزار می تواند در حالت بازگشت مجدد اجرا شده و سطح دیگری از حفاظت داده را به شما ارائه دهد.

مطلب ” RAID چیست و انواع سطوح آن ” را مطالعه فرمایید.