ابزار ETL را میتوان یکی از ابزارهای مهم برای دوستانی دانست که در حوزه تحلیل اطلاعات کار میکنند.
مدتی است برای برقراری ارتباط بین بانکهای اطلاعات مختلف و فایلهای CSV و Excelی که بصورت پراکنده جمع میکنم به دنبال ابزار مناسبی بودم … تا اینکه گزارش سایت http://www.etltool.com را در مقایسه ابزارهای ETL دیدم و به نظرم رسید محتوای این مقایسه را برای دوستان عزیزم که در این حوزه فعالیت دارند به اشتراک بگذارم.
توضیح: برای دوستانی که تا کنون با این ابزارها برخورد نداشتهاند، بد نیست بگویم که ابزارهای ETL برای مبادلات اطلاعاتی بین منابع مختلف به کار میروند. مثلا فرض کنید اطلاعات کارکنان شرکت یا سازمان خود را در بانک اطلاعات سیستم کارگزینی دارید و اطلاعات پرداختهای ایشان را در بانک اطلاعاتی سیستم مالی و مثلا کارکرد ایشان را در نرمافزار پیرنگ :) … حال میخواهید بدانید هریک از کارکنان چه میزان حضور داشتهاند، چه میزان کار ثبت کردهاند و چه میزان حقوق گرفتهاند. برای این منظور نیاز دارید اطلاعات مورد نظر را از این سه بانک اطلاعاتی واکشی نموده و یکجا و بصورت یکپارچه در اختیار داشته باشید (در این مثال اطلاعات منتقل میشوند و نه آدرس آنها). برای اینکار نیاز به ابزاری دارید که اطلاعات مورد نظر شما را از بانک اطلاعاتی مبداء برداشت نموده (Extract) و با تغییراتی (Transform) در مقصد بارگذاری نماید (Load). به این ابزار ETL میگویند و اگر ابزار کارآمدی باشد میتواند کمک زیادی به شما در یکپارچهسازی اطلاعاتی سازمانی نماید. بدیهی است که اطلاعات یکپارچه در سازمان تنها منبع تصمیمات صحیح و موثر مدیریتی خواهد بود. (عزیزانی که علاقمند به مطالعه بیشتر در این حوزه هستند اینجا کلیک کنند).
سایت etltool به تازگی مقایسهای را (بر اساس نظرات کاربران خود) بین ابزارهای مختلف ETL موجود در بازار انجام داده و نتایج آن را منتشر نموده است.
ابزارهای مورد نظر در ۴ گروه مورد مقایسه قرارگرفتهاند:
گروه اول) ابزارهایی که صرفا برای عملیات ETL مورد استفاده دارند.
گروه دوم) ابزارهایی که برای یکپارچهسازی دادههای بانکهای اطلاعات مختلف کاربرد دارند.
گروه سوم) ابزارهای یکپارچهساز داده با کاربرد در Business intelligence
و گروه چهارم) ابزارهای خاص برای موارد خاص
ابزارهای مورد مقایسه را میتوانید در تصویر زیر مشاهده نمایید:
همچنین قابلیتهایی مثل کاربری آسان، قابلیت استفاده مجدد، قابلیت خطایابی، پوشش Web service، کارکردهای پایه، دستیابی و ارتباط پذیری با منابع داده مختلف، معماری از جمله فاکتورهای اصلی در مقایسه انجام شده بوده و البته فاکتورهای متنوع دیگری نیز برای این مقایسه در نظر گرفته شده است (مانند platform، سابقه شرکت، نوع ارائه به بازار و …).
اطلاعات جالب زیادی در این حوزه را میتوانید در آدرس http://www.etltool.com/etl-tools-comparison بیابید.
پی نوشت: برای مثال من ابزار Talend را برای یکپارچهسازی اطلاعات بین فایلها و بانکهای اطلاعاتی مفید یافتم. از ویژگیهای جالب این ابزار ارتباط قوی آن با فایلهای اطلاعاتی (مثل CSV، XML و …) در دریافت و ارسال اطلاعات بود. فعلا نپرسید چرا به این یکپارچهسازی نیاز دارم که نمیتوانم بگویم برای تحلیل نتایج حاصل از مدیریت پروژهها و فرایندها در نرمافزار پیرنگ :)