تابآوری عملیاتی در Microsoft Dynamics CRM : سه راهکار حیاتی برای استمرار خدمت در شرایط بحرانی
امروزه فناوری اطلاعات به دلیل نقش حیاتی در عملکرد سازمانها، بهعنوان ستون فقرات کسبوکارها شناخته میشود.، به همین دلیل سازمانها پیش از اینکه بحران را تجربه کنند، به زیرساختهایی پایدار، قابل اعتماد نیاز دارند. بهرهمندی از راهکارهای نرم افزاری خاص و پیچیده همچون Microsoft Dynamics CRM On-Premises با وجود اینکه مزایای زیادی دارند اما در برابر خطاهای انسانی، اختلال سخت افزاری، وقایع بحرانی همچون حملات سایبری، جنگ و قطعی برق؛ نیاز به حفظ دسترسی، تداوم خدمترسانی و جلوگیری از هدررفت داده دارد.
به همین سبب مجموعه «سامانههای مدیریت» با تکیه بر تجربه گسترده در طراحی، پیادهسازی و پشتیبانی از راهکارهای Microsoft Dynamics CRM On-Premises، سه خدمت حیاتی را برای شرایط بحران به سازمانها پیشنهاد میدهد که در ادامه به معرفی آنها میپردازیم.
خدمات مهم و حیاتی سامانه های مدیریت در زمان بحران
- ایجاد زیرساخت High Availability (HA) بهمنظور اطمینان از پایداری در لایه اپلیکیشن و دیتابیس
- استقرار نود جایگزین و Replication در سطح Active Directory برای حفظ خدمات در صورت بحران
- اجرای مانورهای منظم بازگردانی بکاپ (Backup Restore Drill) برای تست آمادگی واقعی زیرساخت
هریک از این خدمات با هدف افزایش تابآوری و کاهش ریسک و Downtime طراحی شده است که با توجه به نیاز هر سازمان میتوانند کاملا مستقل و ترکیبی پیادهسازی شوند. لازم است در ادامه هرکدام از این خدمات را به صورت مجزا تشریح کنیم تا به صورت کامل با جزئیات آنها آشنا شوید:
راهاندازی High Availability در Dynamics CRM
هدف:
ایجاد پایداری و تحمل خطا (Fault Tolerance) در لایههای مختلف سیستم Microsoft Dynamics CRM با استفاده از تکنولوژیهای HA و Load Balancing
رویکردهای اجرایی HA
الف) Clustering و Load Balancing در لایه اپلیکیشن
در سناریو فوق، چندین سرور Application Server کاملا همزمان نصب و پیکربندی خواهد شد و با بهرهمندی از قابلیت Load Balancer ترافیک کاربران بین هرکدام توزیع خواهد شد. در زمان بروز اختلال در یکی از نودها، سایر سرورها به صورت خودکار مسئولیت ارائه سرویس را برعهده میگیرند.
- استفاده از Network Load Balancer یا Application Gateway
- Health Check و مانیتورینگ خودکار سرورها
- افزایش سرعت پاسخدهی به کاربران با توزیع بار کاری
ب) Failover Clustering در لایه دیتابیس (SQL Server Always On)
در این قسمت بانک اطلاعات سی آر ام در چند نود SQL Server پیادهسازی میشود. در صورت بروز اختلال و خطا در سرور اصلی، به صورت نود ((Node / گره) ) ثانویه کاملا خودکار فعال خواهد شد و سرویس بدون نیاز به دخالت دست ادامه خواهد یافت.
- استفاده از تکنولوژی Always On Availability Groups
- پیادهسازی Listener جهت هدایت خودکار درخواستها به نود فعال
- کاهش چشمگیر زمان Downtime و جلوگیری از از دست رفتن اطلاعات
مزایا:
- حفظ تداوم کسبوکار در زمان خرابی زیرساخت
- کاهش هزینههای عملیاتی ناشی از قطعی سیستم
- پاسخگویی بهتر به نیازهای امنیتی و SLA سازمانها
- فراهم کردن بستر مناسب برای مقیاسپذیری آتی
۲. استقرار نود جایگزین در لوکیشن دوم با Replication Active Directory
هدف:
ایجاد محیطی کاملا عملیاتی که با یک دیتاسنتری جایگزین میشود که با امکان بالاآمدن کامل CRM و سایر بخشهای وابسته که با بهرهمندی از Replication در سطح Active Directory قابل اجرا خواهد بود.
رویکرد اجرایی استقرار نود جایگزین در لوکیشن دوم با Replication Active Directory
- نصب و پیکربندی مجدد Dynamics CRM در سرور ثانویه
- راهاندازی Replication بین Active Directory دو سایت (این کار توسط تیم داخلی مشتری انجام می شود)
- همگامسازی کاربران، OUها، Group Policy و تنظیمات امنیتی (این کار توسط تیم داخلی مشتری انجام می شود)
- انتقال مستمر Backup دیتابیس CRM به سرور دوم (این کار توسط تیم داخلی مشتری انجام می شود)
- تست ادواری برای بررسی قابلیت بازیابی کامل
مشخصات فنی و عملیاتی:
- اجرای پروژه طی 2 تا 3 روز کاری
- بازیابی کامل سیستم در صورت اختلال، ظرف 1 روز
- ذخیرهسازی دیتای Backup در محل دوم (Offsite)
مزایا:
- اجرای سیستم در هر دو لوکیشن با قابلیت Failover دستی یا خودکار
- حداقل زمان Downtime در زمان وقوع بحران
- استقلال عملیاتی از دیتاسنتر اصلی در صورت نیاز
ملاحظات:
- هزینههای بالاتر سختافزاری و لایسنس
- نیاز به تیم فنی هماهنگ در دو محل
- ضرورت تعریف سیاستهای امنیتی یکپارچه
۳. اجرای مانور بازگردانی بکاپ (Backup Restore Drill)
هدف:
تضمین آمادگی زیرساخت و نیروی انسانی سازمان در مواجهه با بحرانهای احتمالی، از طریق شبیهسازی شرایط اختلال و بازیابی سیستم از نسخههای پشتیبان.
رویکرد اجرایی:
- تعریف سناریوهای واقعی اختلال (خرابی کامل سرور، حذف دیتابیس، آسیب فایلها)
- تهیه Snapshot یا Backup فعلی سیستم
- انتقال بکاپ به محیط تست (یا محیط پشتیبان)
- بازگردانی کامل سرویس Dynamics CRM و تست عملکرد آن
- تحلیل مشکلات و تهیه گزارش مستند از مانور
پیشنهاد زمانبندی:
- اجرای دورهای: هر 6 ماه یکبار یا حداقل سالانه
- مدت مانور: 1 تا 2 روز کاری (بسته به ساختار سیستم)
مزایا:
- اطمینان از صحت بکاپها و فرایند بازگردانی
- آموزش ضمنی تیم IT و افزایش آمادگی در بحران
- شناسایی و رفع نواقص احتمالی در مستندات و تنظیمات
خروجی نهایی:
گزارش کامل شامل مراحل اجرا، زمان بازیابی، میزان Data Loss، نواقص شناساییشده و پیشنهادات اصلاحی
نتیجهگیری و پیشنهادات اجرایی
اجرای یکی یا ترکیبی از خدمات فوق به سازمانها این امکان را میدهد که از سطح بالاتری از آمادگی، پایداری و امنیت برای سامانه Dynamics CRM خود بهرهمند شوند. توصیه میشود سازمانها به ترتیب اولویت، ابتدا زیرساخت HA را ایجاد کرده، سپس نود پشتیبان را فعال کرده و در نهایت با اجرای مانورهای منظم، آمادگی خود را حفظ و ارزیابی کنند.
در جهت اطمینان از بک آپ یا بازگردانی صحیح در هنگام بحران، انجام فرآیند Backup Restore ضروری است. این مانور متشکل از مراحل متعددی مانند تعریف سناریوهای واقعی در زمان اختلال است به همین سبب انتقال بک آپ به محیط تست و همچنین بازگردانی سرویس Dynamics CRM ضروری است.
معمولا زمانیکه سازمانها نیاز دارند تا سیستمهای آنها همیشه دردسترس باشد و در عملیات روزمره توقفی نداشته باشند، در شرایطی که قابلیت وقوع بحرانهایی مثل خرابی سخت افزار یا حملات سایبری وجود دارد، بهرهمندی از High Availability برای ایجاد دسترسی مستمر کاملا ضرورت دارد.
مزایای این استقرارمتشکل از افزایش تابآوری سیستم در مقابل بحرانهای طبیعی یا اختلالات سخت افزاری محسوب میشود. علاوه بر این سبب میشود تا در صورت بروز مشکل در دیتاسنتر اصلی، سازمان به سرعت قادر به بازیابی و همچنین ادامه عملیات خود است. مسئله فوق به حفظ خدمات و کاهش زمان Downtime است.