X
تبلیغات
رایتل

کاواندیش

در این وبلاگ خلاصه مطالعات یا تجارب جالب توجه خود در مورد هوشمندی کسب و کار(BI) را منتشر خواهم کرد.

یکشنبه 16 مرداد‌ماه سال 1390 ساعت 01:00 ب.ظ

آشنایی با پاکسازی اطلاعات



با توجه به نقش انکارناپذیر اطلاعات در هوشمندی کسب و کار، برخورداری از اطلاعات با کیفیت دارای اهمیت دوچندان خواهد بود. عدم بهره­ مندی از چنین سطحی از کیفیت، بسیاری از تحلیل­ ها و برنامه ­ریزی­ ها را غیرممکن می ­سازد و چه بسیار تهدیدها و فرصت­ها که به این ترتیب قابل کشف نخواهند بود.


پاکسازی داده  فرایند تشخیص، اصلاح و حذف خطاهای موجود در داده هاست. خطاهای داده شامل داده های غلط، ناقص، تکراری، متناقض ویا با ساختار نامناسب هستند. برای بیان این تعریف از عبارات تمیز کردن داده یا پالایش داده هم استفاده می شود.


در این نوشتار برخی اصول اولیه پاکسازی اطلاعات را ذکر می کنیم. مطالب تکمیلی در آینده به

تدریج اضافه خواهند شد.



سه اصل کلیدی پاکسازی اطلاعات



1- پیشگیری بهتر از درمان است.

لازم است دو رویه پاکسازی اطلاعات و پیشگیری از خطا به موازات هم پیش بروند. تصمیم بر پاکسازی اطلاعات و سپس اندیشیدن به پیشگیری از خطا بدان معناست که خطاها مجدداً بروز خواهند کرد و رویه پاکسازی بایستی مجدداً تکرار شود. همچنین روند پاکسازی اطلاعات به شناسایی علت خطاها و در پیش گرفتن تدابیری جهت پیشگیری از بروز مجدد آنها کمک می­کند.



2- حفظ کیفیت اطلاعات یک وظیفه همگانی است.


چرخه مدیریت اطلاعات شامل کاربران واردکننده اطلاعات، واحدهای پشتیبانی از اطلاعات و کاربران استفاده کننده از اطلاعات می­ باشد. هریک از این کاربران به گونه ­ای در حفظ کیفیت اطلاعات موثر هستند. به عنوان مثال دقت کاربران در هنگام ورود اطلاعات، بررسی دوره ­ای کیفیت اطلاعات توسط واحدهای پشتیبانی و ارائه بازخورد از طرف کاربران استفاده کننده از اطلاعات از عوامل مهم در حفظ و ارتقای کیفیت اطلاعات هستند.



3- نقش آموزش در حفظ کیفیت اطلاعات


بسیاری از نقص­های اطلاعاتی ناشی از آن است که کاربران جهت سرعت بخشیدن به کار خود بدون آگاهی از اهمیت اطلاعات وارده، از ورود برخی اقلام صرف نظر کرده یا مقادیر را به صورت پیش فرض رها می ­کنند. آموزش کاربران وارد­کننده اطلاعات و آگاه­ سازی آنها از اهمیت ورود صحیح اطلاعات و در ادامه کنترل و پیگیری کیفیت اطلاعات وارد شده توسط آنها در فرآیند حفظ کیفیت اطلاعات اهمیت بسزایی دارد.



عوامل ایجاد خطا در سیستم­های اطلاعاتی


برخی از مهمترین عوامل بروز خطا در سیستم­های اطلاعاتی عبارتند از:

  • عدم وجود فرمت مناسب در سیستم ورود اطلاعات( به عنوان مثال تاریخ­ها)
  • عدم اعتبارسنجی محدوده مقادیر وارد شده( به عنوان مثال سن فرد 300 سال وارد شود)
  • اجباری نبودن وارد کردن مقادیر
  • اکتفا به مقادیر پیش فرض سیستم و عدم ورود اطلاعات دقیق
  • تغییرات سیستم در طی زمان و اضافه شدن تدریجی اقلام اطلاعاتی
  • عدم یکپارچگی سیستم­ها و تکرار اطلاعات
  • امکان وارد کردن چند مقدار در یک فیلد( به عنوان مثال، وارد کردن چند شماره در کنار هم به عنوان شماره تلفن)
  • عدم دقت کاربران در ورود اطلاعات

 

پی نوشت: مطالب ذکر شده در این نوشتار بخشی از مقاله ای می باشد که توسط اینجانب در ماهنامه داخلی شرکت بیمه پارسیان منتشر شده است.