سیستم پایگاه داده سیار یا به اختصار MDS به سیستمی گفته می شود که قابلیتهای یک پایگاه داده کامل را به صورت کاملا متحرک داشته باشد.همانطور که از اسم سیستم پیدا است این نوع از پایگاه داده،یک سیستم سیار است که به دو صورت کابلی و بی سیم می تواند ارتباط برقرار کند . کارکرد اصلی این سیستم در ارتباط بیسیم آن می باشد که می تواند به دو صورت GSM یا PCS باشد.
ارتباط PCS و GSM
سیستمهای سلولی در ابتدا بر اساس انتقال آنالوگ کار می کردند . این سیستم ها رشد سریعی را در اروپا و آمریکای شمالی تجربه کرد اما به خاطر محدودیت های ذاتی که داشت و با رشد سریع مشترکین ، نتوانست به سرعت آنان رشد کند. این مسئله باعث شد تا دو سیستم ارتباطی سیار به نام های PCS و GSM رشد کنند . PCS در آمریکای شمالی و GSM در اروپا که هر دو دیجیتالی بودند جایگزین تکنولوژی قبلی که آنالوگ بود شد. PCS برای سرویس دادن به مشترکین قبلی ، ارسال آنالوگ را نیز پشتیبانی می کرد اما GSM فقط دیجیتالی بود.محاسبات سیار نتیجه ی پیشرفتهای صورت گرفته در دو فناوری زیر است :
• ظهور کامپیوترهای قابل حمل قدرتمند
• شبکه های سریع قابل اطمینان
1. واحد سیار( MU ) : این کامپوننت به نام های Mobile Host و Mobile Station نیز خوانده می شود. آن( MU ) یک دستگاه بی سیم است که شامل 1.آنتن 2.فرستنده/گیرنده [3. رابط کاربر . آنتن سیگنالها را به دام می اندازد و فرستنده/گیرنده مسئول دریافت و ارسال سیگنال است. رابط کاربر مسئول تعامل با کاربر از طریق نمایش دادن گرافیک و متن و دریافت ورودی کاربر است. هر یونیت داراری حافظه دائمی است که شامل اطلاعاتی از قبیل : شماره شناسایی سیار( Mobile Identification Number ) ، شماره سریال الکترونیکی ( Electronic Serial Number ) ، نوع کلاس ایستگاه ( Station Class Mark ) .شماره شناسایی سیار یک شماره 10رقمی مشترک است ، زمانیکه واحد سیار درخواست مکالمه می کند شماره مقصد توسط MSC به تمام ایستگاهها فرستاده می شود ، اگر ایستگاه با شماره مورد نظر در ارتباط باشد بلافاصله ارتباط برقرار می گردد. شماره سریال الکترونیکی یک شماره منحصر به فرد 32 بیتی است که برای شناسایی یونیت توسط سلول به کار می رود لازم به ذکر است که این شماره سخت افزاری است و قابل تغییر نیست.
2. ایستگاه اصلی( BS ): ایستگاه اصلی شامل یک جفت فرستنده و گیرنده است. هر سلول فقط توسط یک BS اداره می شود و اندازه سلول نیز به قدرت BS بستگی دارد. در معماری PCS فعالیتهای BS شامل : برقرای ارتباط ، مکان یابی یک کانال ارتباطی ، و... می شود که مستقیما توسط MSC مدیریت می گردد. زمانیکه یک مشترک سیار شماره ای را می گیرد BS آن سلول کانالی را MSC اش می گیرد تا تماس برقرار کند و وقتی که تماس تمام شد کانال را به MSC بر میگرداند.
3. کنترل کنندۀ ایستگاه اصلی ( BSC ): این قطعه باری مدیریت BS ها است که بیشتر در GSM کاربرد دارد.
4. مرکز سوئیچ سیار ( MSC ): این کامپوننت با نام های MTSO (MobileTelephone Switching Office) mobile switch (MS) نیز خوانده می شود . همانطور که از نامش پیداست وظیفه ی سوئیچ در شبکه را بر عهده دارد . ممکن است در شبکه های بزرگ از چند MSC که باسیم به هم متصل ان استفاده شود.
5. ثبت کننده مکان خانگی ( HLR ): یک دیتابیس بسیار بزرگ است اطلاعات مشترکین را نگهداری می کند
6. ثبت کنندۀ مکان ویزیتور( VLR ): VLR یک زیر مجموعه از HLR برای یک سلول خاص است.هر موقع که مشترکی بخواهد تماسی بگیرد اطلاعات آن در VLR قرار میگیرد و پس از مکالمه در HLR بایگانی می گرددو VLR خالی می شود.
7. شبکه تلفن عمومی( PSTN ): این کامپوننت همان شبکه تلفن سیمی است که عموما از طریق خط تلفن به آن دستیابی دارند.
8. شبکه دیجیتالی یکپارچه( ISDN ): یک شبکه سیمی است که توانایی فرستادن صدا و داده ها را با سرعتی بالا دارد.
معماری پایگاه داده سیار
در پایگاه داده سیار اولین عضو واحد سیار( MU ) است که ممکن است تلفن همراه ، PDA MP3 player ، و یا حتی سیستم های ناوبری ماشینها باشد. هر واحد سیار با یک ایستگاه اصلی (BS) در ارتباط است که با هم یک سلول (Cell) را تشکیل می دهند. یک سلول از طریق کنترل کنندۀ ایستگاه های اصلی (BSC) به میزبانهای ثابت یا همان شبکه های ثابت متصل می شود. در سیستم پایگاه داده سیار یک پایگاه داده HLR است که شامل اطلاعاتی از قبیل شماره شناسایی (ID) ، آخرین مکان دیده شده ، نوع ارتباط و ...می شود و یک پایگاه داده VLR که خود زیر مجموعه ای از HLR است وجود دارد .زمانیکه یک سلول جدید ایجاد یا دیده می شود مقعیت جاری آن در VLR ذخیره می شود که در نهایت این اطلاعات در HLR بایگانی می شود . هر HLR با AC که یک پردازنده برای اعتبار دادن به شاخص ها(مانند کانال های دستیابی)است، در ارتباط است.و در نهایت MSC با شبکه سوئیچ تلفن های عمومی (PSTN) در ارتباط است. EIR نیز یک دیتابیسی شامل شماره سریال های منحصر به فرد برای اختصاص دادن به MU های جدید است.
ویژگی های سیستم پایگاه داده سیار
اگرچه یک شبکه بی سیم با مشتری های سیار اساسا یک سیستک نامتمرکز است اما ویژگی های خاص آن( MDS ) این محیط را منحر به فرد کرده است برخی از مهمترین ویژگی های محیط سیار عبارتند از :
• کم بودن پهنای باند
• نامطمئن بودن کانالهای بی سیم برای انتقال داده
• آسیب پزیری با شرایط فیزیکی
• نامتقارن بودن ارتباطات : پهنای باند در جهت رو به پایین جریان (از سرویس دهنده به مشتری ) بسیار بیشتر از جهت معکوس آن است.اگرچه مشتری ها می توانند داده ها را با نرخ بالایی دریافت نمایند ، اما در برخی سیستم ها مشتری قادر به ارسال پیام های زیادی به سرویس دهنده نمی باشد.
• قطع شدن متناوب : مشتری های سیار (برخلاف میزبان های ثابت ) به طور پیوسته و مداوم به شبکه متصل نمی مانند بلکه کاربران ، واحدهای سیار خود را به طور منظم خاموش روشن می کنند.
• انرژی محدود : برخی از واحدهای قابل حمل از لحاظ میزان انرژی باتری (تا قبل از شارژ مجدد) به شدت محدودیت دارند.
دسته بندی داده ها در MDS
داده ها در MDS به دو دسته ی داده های وابسته به مکان و داده های مستقل از مکان تقسیم میشوند.داده های نوع اول ارزششان به مکانشان بستگی دارد مانند: مایات شهری ، منطقه شهری و... ، اما دسته ی دوم ارزششان به مکان بستگی ندارد و از اینرو آنها را مستقل از مکان می نامند.مانند نام شخص ، شماره حساب بانکی و...
داده های LDD باید توسط همان منطقه پردازش شود که اصطلاحا Location binding می گویند.
مدیریت تراکنش در پایگاه داده سیار
تمام اصول مدیریت تراکنش ها که برای پایگاه داده های متمرکز و نامتمرکز وجود دارد در پایگاه داده های سیار نیز لحاظ می شود اما ویژگی ها و محدودیت های محیط سیار سبب می شود که تراکنش و مدیریت آن تا حدودی متفاوت باشد .
یک تراکنش سیار ، تراکنشی است که حداقل از یک میزبان سیار استفاده می کند ، پس در مدیریت تراکنش های بانک اطلاعات سیار باید تغییر مکان میزبان های سیار را نیز در نظر گرفت.
اجرای یک تراکنش سیار که در میزبان های ثابت و سیار انجام می گیرد را می توان به صورت زیر تقسیم کرد:
اجرا به طور کامل در شبکه غیر بی سیم.
اجرای به طور کامل روی یک میزبان سیار
اجرا به طور نامتمرکز روی شبکه غیر بی سیم و میزبان سیار
اجرا به طور نامتمرکز روی چند میزبان سیار
اجرا به طور نامتمرکز بین میزبان های سیار و ثابت
نکته ی مهم این است که در MDS رعایت قانون ACID یعنی یکپارچگی، همخوانی ، انزوا و پایایی بسیار گران و هزینه بر است
معرفی كسب و كار هوشمند ( BI) و انباره داده تحلیلی (DW)
انبارهسازی داده فرآیندی است که طی آن دادههای جدا از هم موجود در منابع متعدد دادهای در سازمان كه با ابزار و فرمتهای مختلف ذخیرهسازی شدهاند، . بصورت یكپارچه و در یك قالب گردهم جمعآوری میگردند. از ویژگیهای انباره تحلیلی داده که باعث برتری آن نسبت به پایگاههای داده شده است, استفاده از مدلهای چند بعدی داده است. این ویژگی مخزن داده، ضمن تسریع در روند تهیه گزارشات، امكان تهیه گزارشات سطح بالا، راهبردی و چندبعدی را برای سازمان فراهم مینماید. میتوان از انباره تحلیلی داده با این ویژگیها در دادهکاوی (Data Mining) نیز استفاده نمود.
برخی از دلایل نیاز سازمانها به انباره تحلیلی داده
- كثرت منابع دادهای در سازمانها كه منجر به
استفاده از ابزارها، روشها و قالبهای مختلف در ذخیرهسازی دادهها شده است كه
این امر سازماندهی دادههای مختلف به منظور تولید اطلاعات و دانش را، دچار مشكل
اساسی كرده است.
- ناهمگونی در ذخیرهسازی اطلاعات، تكرار در ذخیرهسازی
اطلاعات، یكپارچهنبودن اطلاعات در سیستمهای اطلاعاتی سازمان، عدم وجود تاریخچه
دادهای و نبود دادههای خلاصهبندی شده.
- بالا بودن حجم اطلاعات در سازمانهای بزرگ كه منجر به توسعه
سیستمهای اطلاعاتی متعدد و جزیرهای شده است.
- خودكارسازی فرایندهای اجرایی در سازمانها در قالب سیستمهای
اطلاعاتی غیریكپارچه و نامرتبط كه هر كدام از این سیستمها وظیفه خودكارسازی تنها
یك بخشی از كسب و كار سازمان را بر عهده دارند.
- تغییر رویكرد سازمانها در تولید محصولات و ارائه خدمات از
رویكرد تولید انبوه به رویكرد بومیسازی انبوه كه این امر تنها از طریق شناسایی
رفتار مشتریان و پیشبینی رفتار آتی آنها امكانپذیر خواهد بود. دستیابی به این
مهم مستلزم كسب دانش در مورد روند حاكم بر رفتار مشتریان -از طریق یكپارچهسازی و
سازماندهی دادههای موجود در سیستمهای متعدد عملیاتی سازمان- است.
مزایای كلی استفاده از انباره تحلیلی داده
- بهرهمندی از یك منبع یكپارچه و منسجم از دادههای
تولیدشده توسط سیستمهای اطلاعاتی و منابع دادهای متعدد در سازمان
- ارتقای سطح كیفی تصمیمات راهبردی در سازمان با اتكا با
گزارشات تولیدشده توسط یك انباره تحلیلی دادهای یكپارچه
- ایجاد مزیت رقابتی پایدار برای سازمان و افزایش شانس
موفقیت در رقابتهای تجاری
- ارتقای سطح كارایی و اثربخشی فعالیتهای سطوح تاكتیكی و
راهبردی سازمان
- برقراری ارتباط قویتر با سایر اجزای موجود در زنجیره تامین
سازمان از جمله مشتریان و فروشندگان
علاوه بر انباره تحلیلی داده، سیستمهای هوشمندی كسب و كار نیز یكی از مهمترین فناوریهای نوین اطلاعاتی در استفاده از دادهها به منظور تولید اطلاعات و دانش مورد نیاز جهت ارتقای سطح كیفیت تصمیمات راهبردی در سازمان میباشد.
معرفی هوشمندی كسب و كار( BI) و ضرورت بكارگیری آن
هوشمندی كسب و كار عبارتست از ارائه اطلاعات مناسب، در زمان مناسب، در قالبی مناسب به کاربر مورد نظر برای پشتیبانی از فرایند تصمیم گیری. هوشمندی كسب و كار ابزاری جهت تولید دانش در میان انبوهی از دادهها و اطلاعات میباشد. BI مجموعه وسیعی از فناوریها برای جمع آوری اطلاعات و دانش در سطح یک سازمان و کمک به فرایند تصمیم گیری از طریق تجزیه و تحلیل این اطلاعات و دانشها با ایجاد پرس و جو میباشد. نکته مهمی که باید مد نظر قرار گیرد این است که وظیفه هوشمندی كسب و كار، تمهید اقدامات مقتضی از روی اطلاعات به منظور ارتقای سطح كارایی و اثربخشی در سازمان هاست. سیستم هوشمندی كسب و كار یکی از نیازهای مبرم در بازار رقابتی کنونی میباشد. این راه حل مشتمل بر یكسری ابزار است كه این ابزارها بر روی دادههای موجود در مخازن داده، پردازشهای لازم را انجام داده و اقدام به تولید گزارش برای کاربران مینماید. این اطلاعات در بهتر کردن خدمات رسانی به كاربران(كه عمدتا مدیران ارشد سازمان هستند) نقش بسیار مؤثری را ایفا مینمایند. سازمانها با استفاده از این ابزارها قادر خواهند بود وضعیت خود و رقیبان را به راحتی شناسائی کنند. سیستمهای هوشمندی كسب و كار، امكان استخراج انواع روندها از دادههای موجود در مخازن داده را فراهم مینمایند. كه این روندها در اتخاذ تصمیمات راهبردی و برنامهریزی برای آینده به مدیران کمک شایان توجهی مینمایند. همچنین سیستمهای هوشمندی كسب و كار، امكان تولید گزارشات راهبردی پیچیده جهت استفاده در لایههای تصمیمگیر سازمان را فراهم مینماید. برخی از کارکردهای سیستمهای هوشمندی كسب و كار عبارتست از:
- استخراج داده ها از منابع متعدد نظیر سیستمهای مدیریت ارتباط با مشتری (CRM)، مدیریت زنجیره تامین (SCM)، برنامه ریزی منابع سازمان (ERP) و یا از سایر برنامه های کاربردی.
- ارائه ابزار تحلیل که به طیف وسیعی از متخصصان فنی و تجاری امكان ارائه پرس و جو هایی برای کشف الگوها و تشخیص مسائل را میدهد.
در فضای هوشمندی كسب و كار، تحلیلگرهای فنی و تجاری از ابزار متنوعی برای
دسترسی به داده ها، تحلیل اطلاعات و مشاهده نتایج بهره میگیرند که شامل موارد ذیل
میباشد:
- ابزار پرس و جو و گزارش گیری: بسیاری از سیستمهای BI به کاربران اجازه میدهند که تحلیلهای Slice-and-Dice (شکستن اطلاعات به قطعات
کوچکتر برای بررسی آنها از دیدگاه های مختلف برای فهم بهتر آنها) بر روی اطلاعات
ذخیره شده بر روی پایگاه داده رابطه ای انجام دهند. اغلب کاربران از پرس و جو ها و
گزارشهای پیشساخته بهره میبرند.
- OLAP و داده کاوی: ابزارهای تحلیل OLAP و ابزارهای داده کاوی به کاربران اجازه میدهد تحلیلهای پیشگویانه و چند
بعدی (تحلیلهای Drill-down) -تحلیلی
که بر اساس جستجو در میان اطلاعات بر اساس یک سلسله مراتب مشخص است- انجام دهند.
- مدیریت کارایی کسب و کار(BPM): این رویکرد، مدل توسعه یافته رویکرد قدیمیتر
Business Scoreboards (یک تکنیک تحلیل برای تبدیل
استراتژیهای کلی سازمان به اهداف مشخص و قابل اندازه گیری برای نظارت بر کارایی
سازمان) میباشد و میتواند
شامل مدیریت مالی، سازمانی، خدمات مشتری و زنجیره تامین باشد.
- نمایش اطلاعات: نمایش نتایج پرس و جو ها و گزارشها
میتواند از طریق برنامه های کاربردی اختصاصی، Dashboard ها (برنامه های کاربردی که اطلاعات را از مولفه های مختلف بصورت یکپارچه و
واحد نمایش میدهند)، و یا درگاههای اینترانت و یا اکسترانت صورت پذیرد.
با عنایت به موارد فوقالذكر، انباره تحلیلی داده و سیستمهای هوشمندی كسب و كار در صنایعی چون بانكداری و بیمه، خدمات مالی و سرمایهگذاری، نفت و گاز، تولیدی، نیرو، وزارتخانه و سازمانهای خدمات دولتی و ... دارای بیشترین كاربرد میباشد.
تاریخچه و تعاریف انباره داده
بعد از رشد استفاده از TPSها بعنوان سیستمهای پردازش تراكنش در بخشهای عملیاتی سازمان، نیاز جدی به سیستمهای اطلاعاتی كه بتوانند عملیات گزارشگیری را علیالخصوص در رده گزارشهای مدیریتی ساماندهی كنند احساس میشد. علیالخصوص بوجود آمدن جزایر فناوری، سیستمهایی كه بصورت جدا از هم فعالیت میكردند و امكان تهیه گزارشات تركیبی از اطلاعات سیستمهای مختلف و انجام پرس و جوها را مشكل و یا غیرممكن مینمود. بنابراین حركت فناوری به سمت استفاده از سیستمهای اطلاعات مدیریت (MIS:Management Information Systems) و بویژه سیستمهای گزارشگیری مدیریتی (MRS: Management Reporting Systems) آغاز شد. اما مشكل آنجا بود كه این سیستمها به شدت به TPSها وابسته بودند و دادههاشان اغلب یكی بود. این باعث میشد كه تغییر یكی باعث انتشار تغییرات در همه سیستمها شود. از سوی دیگر ساختار دادهای مشابه، امكان تهیه گزارشات زمانی و موضوعی را مشكل میساخت. از اینرو مدل جدیدی از تفكر به انباره تحلیلی داده ایجاد شد.
تاریخچه
انبارههای تحلیلی داده در اواخر دهه 1980 و اوایل دهد 1990
بعنوان نوع متمایزی از پایگاههای داده مطرح شدند. انبارههای تحلیلی داده برای
رفع نیازهای روزافزون تحلیلی و اطلاعات مدیریتی كه توسط سیستمهای رابطهای قابل
برطرف ساختن نبودند، گسترش یافتند. سیستمهای رابطهای به دلایل زیر قابلیت
پاسخگویی به این نیازها را ندارند:
- باری كه بخاطر پردازشهای گزارشگیری بر روی این سیستمها
ایجاد میشود، زمان پاسخگویی را بسیار كاهش میدهد.
- طراحی سیستمهای رابطهای برای گزارشگیری و تحلیل اطلاعات
بهینه نمیباشد.
- از آنجاكه بسیاری از شركتها و سازمانها تعداد بیش از یك
سیستم رابطهای دارند، گزارشگیریهای در سطح سازمانی كه وابسته به اطلاعات كلیه
سیستمهای رابطهای سازمان هستند، به سادگی به دست نمیآیند.
- ایجاد گزارش در سیستمهای رابطهای اغلب نیازمند نوشتن
برنامههای خاص كامپیوتری كه معمولا كند و گرانقیمت هستند بوده است.
از اینرو، پایگاههای داده مجزایی طراحی شدند كه بصورت
اختصاصی برای پشتیبانی از اطلاعات و تحلیلهای مدیریتی بكار روند. این انبارههای
داده قادر به جمعآوری دادهها از منابع دادهای مختلف و ناهمگون مانند
كامپیوترهای پردازنده مركزی ، مینی كامپیوترها و كامپیوترهای شخصی ، همچنین نرمافزارهایی
مثل spreadsheetها بوده و
تمامی این اطلاعات را در یك مكان مشترك ذخیره میكنند. این قابلیت به همراه
استفاده از ابزارهای گزارشگیری آسان و خلاصی از مشكلات رابطهای موجب رشد این نوع
از سیستمها گردید.
با پیشرفت فناوری و درنتیجه پایین آمدن هزینهها، بالا رفتن
كارائی و افزایش نیازهای كاربران مثل زمان كوتاهتر برای بارگذاری دادهها، انبارههای
تحلیلی داده به چهارگروه اصلی تقسیم بندی شدند:
۱- پایگاههای داده
رابطهای برونخطی : در سادهترین سطح، یك انبارهداده با كپی كردن اطلاعات یك
پایگاهداده رابطهای به یك سرور برونخطی ایجاد میشود. بدین ترتیب، بار گزارشگیری
بر روی كارائی سیستم رابطهای اثر منفی نخواهد داشت.
۲- انبارههای داده برونخطی
: در این حالت انبارهداده در یك دوره زمانی
ثابت (بصورت روزانه، هفتگی یا ماهانه) از روی سیستمهای رابطهای منبع بهروز شده
و دادههای مربوطه بر روی یك ساختمان داده گزارش گرا ذخیره میشوند.
۳- انبارههای داده
بلادرنگ : این نوع انبارههای داده بر اساس یك تراكنش یا رویداد عمل میكنند؛ بدین
ترتیب كه هربار كه سیستم رابطهای تراكنشی (مثل عملیات سفارش یا رزرو) را صورت میدهد،
انبارهداده به روز میگردد.
۴- انبارههای داده
مجتمع : در این حالت انباره داده فعالیتها یا تراكنشهایی را ایجاد میكند كه جهت
استفاده روزانه سازمان به سیستمهای رابطهای برگردانده میشوند.
طبق تعریفی كه در سال 1992 توسط Bill Inmon برای انباره تحلیلی داده آورده شده است : یك انباره تحلیلی داده مجموعهای موضوع گرا ، یکپارچه ، متغیر با زمان و بدون تغییرحالت ناگهانی از داده هاست كه در فرآیند تصمیم گیری مدیریت را یاری می كند. این چهار خاصیت اصلی، انباره داده را از دیگر مخازن نگهداری داده ها متمایز می كند.
دلایل نیاز سازمانها به فناوریهای EDW و BI
میتوان از
مهمترین دلایل نیاز به انبارههای دادهای به موارد زیر اشاره نمود:
- امروزه اكتسابات و ادغامات سبب تولید سیستمهای كامپیوتری گوناگونی در شركتهای بزرگ شدهاند. به عنوان مثال، بانكهای بزرگ، غالبا
چند نوع سیستم برای انجام كارهای مشابه دارند.
- خودكارسازی تمام قسمتهای یك تجارت به صورت ادغام نشده و یكپارچه
نشده با تعداد مختلفی سیستم كه هركدام گوشهای از كار را دربر میگیرند، اجرا میشود. (همانند داستان آن مرد نابینایی كه به فیلی برخورد میكرد و با لمس هر قسمت از بدن فیل استنباط
خاصی داشت.)
- انعطاف پذیری در زمینه بازار سبب به وجود آمدن محصولات
بسیاری شده است، و در واقع تولید انبوه بهتنهایی مد نظر نمیباشد، بلكه سفارشگیری انبوه و سپس بازاریابی هدف واقعی است. روند كار به
سوی جمعآوری و استفاده از
اطلاعات میباشد.
به خصوص دانش در رابطه با مشتریان، محصولات، بازار و رقیبان، و به طور كلی دادههای موجود درون سیستمهای عملیاتی كم هزینهترین راه جمعآوری دانش در مورد مشتریان میباشد.
- تمركز رو به رشد بر روی خدمات به جای محصولات سبب به وجود
آمدن فضاهای خالی ارتباطی گردیده است. این فضاهای خالی براساس دیدگاههای مختلفی كه از تجارت نتیجه میشود وجود دارد و تا زمانی كه اصلاح نشود میتواند به اهداف راهبردی و حساس صدمه وارد
كند.
هر فردی درون سازمان میتواند راجع به اینكه چند واحد و در چه زمان فروخته شود نظر دهد ولی مثلا
بخش بازاریابی درون بانك ممكن است تعریفی متفاوت از « وام مشتریان» (نحوه استفاده
از وام) نسبت به مدیریت ریسك (شرایط
وام دادن) داشته باشد. بنابراین گزارشاتی كه توصیف كننده وام مشتریان است، نسبت به
گزارشی كه جزئیات ریسك را بر روی محصولاتی مشابه عرضه میكند، متفاوت میباشد.
- فن آوری میتواند از انباره دادهای پشتیبانی كند. رقابت درون بازارهای عمده و میانی نیازمند محاسبات و
ذخیرهسازی كم هزینهای است. چرا كه در زمانی مشابه، فن آوریهای موازی جدید سازنده پایگاههای دادهای چند ترابایتی میباشند
بنابراین دلایل استفاده از انباره داده را می توان در موارد
زیر خلاصه نمود:
مشکلات محیطهای قدیمی
- سطح عملیاتی مختلف
- نمایش داده ای مختلف
- اطلاعا ت ذخیره شده ناسازگار و ناهمگن و دو بار ذخیره شده
- یکپارچه نبودن اطلاعات در سیستمها
- كمبود تاریخچه داده ای
- نبود داده خلاصه بندی شده
نیاز مدیران امروز
- از دید اطلاعاتی بتوانند تصویر واضح و کاملی نسبت به کار و
تجارت خود داشته باشند.
- داده های یکپارچه در سطح کارکردی داشته باشند.
- تاریخچه داده ای مختصر و با جزئیات کافی داشته باشند.
- نهایتا برای رفع مشکلات مذکور و بر آوردن نیازهای مدیران
در تصمیم گیریها ایده انباره داده مطرح گردید.
مزایای استفاده از فناوریهای EDW و BI در سازمانها
بهرهگیری از انبارههای تحلیلی داده دارای مزایای بسیاری است. از جمله
مزیتهای آن عبارتند از:
- بالابردن امكان دسترسی كاربران به حجم زیادی از دادهها.
- امكان ارائه گزارشهای خاص سیستمهای تصمیم یار
- تقویت برنامههای كاربردی تجاری مثل مدیریت ارتباط با
مشتری
- بهتر کردن کیفیت تصمیم گیری
- افزایش شانس موفقیت در رقابتهای تجاری
- برقراری ارتباط قویتر با مشتریان
- بهتر کردن سطح عملیاتی
- بهتر کردن رابطه فروشندگان و مشتریان
امروزه موسسات غالبا دارای دو نوع بانک اطلاعاتی مستقل هستند
که یکی از این بانکها حاوی داده های عملیاتی و بانک دیگر انباره داده می باشد که
حاوی دادههای مبتنی برتصمیمگیری است.
فرآیند پیادهسازی این پروژه در یك سازمان
معماری انباره تحلیلی داده از سه لایه تشكیل شده است:
- در اولین لایه این معماری، سرویس دهنده انباره تحلیلی دادهای
است که یک سیستم پایگاه داده رابطهای می باشد . این لایه داده های مورد نیاز خود
را از داده های عملیاتی و منا بع خارجی و فایلهای مسطح و غیره برای ایجاد انباره
داده استخراج می کند.
- در لایه میانی یک سرویس دهنده پردازش تحلیلی برخط میباشد
که بوسیله آن میتوان مکعب های چند بعدی ساخت . پردازش تحلیلی برخط یک ابزار
قدرتمند، سریع و مناسب برای گزارشگیری میباشد.
- در آخرین لایه ما ابزارهای گزارش گیری و تحلیل و داده کاوی
را داریم.
برای پیادهسازی یك انباره داده باید هریك از این لایهها به
درستی پیادهسازی شوند.
اخذ داده
اخذ داده از منابع مربوطه (پایگاه داده منبع) انجام میگردد.
این مرحله بخش استخراج اطلاعات (Extract) از سری عملیات ETL است.
برای انجام عملیات اخذ داده، باید منبع اخذ داده، نحوه اخذ داده، فرمت دادههای
اخذ شده و مقاطع زمانی اخذ دادهها، همچنین نحوه دسترسی به این دادهها معلوم و
مشخص باشد.
بررسی و پاكسازی داده ها
این مرحله بخش تغییر شكل (Transform) از عملیات ETL است.
بررسی و پاكسازی داده های استخراج شده جهت ورود به انباره تحلیلی داده در این
مرحله انجام میگیرد. پس از بررسی جداول موجود، فیلدهای موجود در جداول و محتویات
فیلدهای مذکور، كلیه مشكلات دادهای در قالب لیستی ارائه میگردند. سپس عملیات پاكسازی برای آنها انجام میگیرد.
این عملیات غالبا در زمره یكی از موارد زیر هستند:
- حذف مقادیر null
- هم مقدار سازی فیلدهای مشابه از نظر معنا
- ایجاد فیلدهای كمی جدید قابل بدست آمدن از روی دادههای
جدول و مورد نیاز
- یكی كردن دادهها از منابع مختلف
- خلاصه سازی سطرهای هم معنی كه ایجاد افزونگی میكنند.
- ایجاد كلید جانشین برای جداول
- Pivoting (تبدیل چند ستون به چند سطر یا بالعكس)
- تقسیم یك ستون جدول به چند ستون
طراحی انباره تحلیلی داده موضوعی
انباره تحلیلی داده موضوعی: از آنجا كه كاربران مختلف با نیازهای متفاوتی
وجود دارند كه میتوانند از دادههای درون انباره استفاده كنند، برآوردن نیازهای
تمام كاربران به وسیله یك سیستم مركزی همیشه امكان پذیر نیست. از طرفی یك سیستم
مركزی، متمركز بر روی داده و سیستم میباشد و كاربر نهایی ممكن است كه بخواهد
كنترل بیشتری روی محیط اطلاعاتی خود داشته باشد. راه حل این مشكلات مرکز داده ای است، كه به آن انباره دادهای سازمانی نیز
گفته میشود. مرکزداده ای، انباره داده خاصی است كه دادههای مورد نیاز برای یك
بخش از سازمان یا كاربرهای مرتبط به آن را جمع آوری میكند. طراحی مراكز دادهای مربوطه بنا به صلاحدید فرد خبره در قالب مدل ستارهای
یا دانهبرفی و یا طرح منظومه حقایق صورت میگیرد.
طرح ستارهای: عمومیترین نمونه برای مدلسازی مدل چند بعدی،
طرح ستاره است. در این طرح انباره داده شامل یک جدول بزرگ مرکزی به نام جدول حقایق
و یک سری جدول کوچکتر به نام جدول بعد یا جدول بعد که وابسته به جدول حقایق هستند
میباشد.
طرح دانه برفی: این طرح، تغییریافته طرح ستارهای است
بطوریکه بعضی از جداول بعد، نرمال شدهاند. تفاوت اصلی بین طرح ستارهای و طرح
دانه برفی این است که جدول بعد در طرح دانهبرفی به فرم نرمال نگهداری میشود تا
میزان افزونگی کاهش پیدا کند. این کار باعث کاهش میزان حافظه مورد نیاز خواهد شد.
البته صرفهجویی در فضای ذخیرهسازی جدول بعد در مقایسه با حجم جدول حقایق ناچیز
است چون تعداد اتصالاتی که برای پردازش یک گزارش باید گذارده شود در این حالت
افزایش مییابد و مدت زمان پاسخدادن به گزارش در مدل دانه برفی بیشتر از مدت زمان
لازم در مدل ستارهای است بنابراین غالبا طرح دانه برفی در طراحی انباره داده
عمومیت طرح ستارهای را ندارد مگر آنكه بنا بر صلاحدید فرد خبره بر طرح ستارهای
ترجیح داده شود.
طرح منظومه حقایق: هنگامی كه نیاز به چندین جدول حقایق وجود
دارد که دارای جداول بعدهای مشترک هستند، طرحی ایجاد میشود که به آن طرح کهکشان
یا منــظومه حقایق میگویند. یک طرح منظومه حقایق به جداول ابعاد اجازه میدهد که
بین جداول حقایق مشترک باشند.
تحلیل داده با ابزار پردازش تحلیلی برخط و دادهكاوی
عملیات پردازش تحلیلی برخط بر انبارهدادههای موضوعی اعمال میگردد.
بسیاری فکر می کنند که داده کاوی و OLAP دو
چیز مشابه هستند در این بخش سعی می کنیم این مسئله را بررسی کنیم و همانطور که
خواهیم دید این دو ابزار های کاملا متفاوت می باشند که می توانند همدیگر را تکمیل
کنند.
OLAP جزیی از تكنیكهای تصمیم گیری می باشد. سیستم های سنتی
گزارش گیری و پایگاه داده ای آنچه را که در پایگاه داده بود توضیح می دادند حال
آنکه در OLAP هدف بررسی دلیل
صحت یک فرضیه است.بدین معنی که کاربر فرضیه ای در مورد داده ها و روابط بین آنها
ارائه می کند و سپس به وسیله ابزار OLAP با
انجام چند Query صحت آن فرضیه را
بررسی می کند. اما این روش برای
هنگامی که داده ها بسیار حجیم بوده و تعداد پارامترها زیاد باشد نمیتواند مفید
باشد چون حدس روابط بین داده ها کار سخت و بررسی صحت آن بسیار زمانبر خواهد بود. تفاوت داده کاوی با OLAP در این است که داده کاوی برخلاف OLAP برای بررسی صحت یک الگوی فرضی استفاده نمی شود بلکه خود سعی می کند این
الگوها را کشف کند. درنتیجه
داده کاوی و OLAP می توانند همدیگر
را تکمیل کنند و تحلیل گر می تواند به وسیله ابزار OLAP یک سری اطلاعات کسب کند که در مرحله داده کاوی می تواند مفید باشد و
همچنین الگوها و روابط کشف شده در مرحله داده کاوی می تواند درست نباشد که با
اعمال تغییرات در آنها می توان به وسیله OLAP بیشتر بررسی شوند.