خانه / آموزش / آشنایی با مفاهیم و ویژگی های کلان داده (Big Data) (قسمت اول)

آشنایی با مفاهیم و ویژگی های کلان داده (Big Data) (قسمت اول)

تعاریف متعددی در رابطه با کلان داده یا همان Big Data وجود دارد ولی جامع‌ترین تعریف، چهار شرط را تعیین می‌کند که به تئوری4V معروف است توضیحات طولانی که در مورد بیگ دیتا یا همان کلان داده گاها ددیه می شود بیشتر سبب سر در گمی فردا می شود، در حقیقت این چهار اصل ساده ترین راه درک مفهوم کلان داده و ویژگی های اصلی آن است:
🔹 1.Volume
🔹 2.Variety
🔹 3.Velocity
🔹 4.Value

1- حجم داده یا Volume: از سال ۲۰۱۲، تقریبا روزانه ۲٫۵ اگزابایت داده تولید می­‌شود و این مقدار، هر ۴۰ماه، دوبرابر می­‌شود. همچنین تخمین زده می­‌شود که والمارت، هر ساعت ۲٫۵ پتابایت داده از تراکنش‌های مشتریانش، جمع‌آوری می‌کند. همچنین، موفقیت شبکه­‌های اجتماعی، موجب تولید حجم عظیمی از محتوا شده است؛ برای نمونه، توییتر، روزانه به تنهایی ۱۲ترابایت داده تولید می‌کند.

2- تنوع داده یا Variety: منابع داده­‌های عظیم می­‌تواند از چندین مبدا و در شکل­‌های ناهمگون مانند، پیام­‌ها، بهنگام­ سازی‌ها و تصاویر ارسال­ شده در شبکه­‌های اجتماعی، سیگنال­‌های GPS از گوشی‌های سلولی و غیره باشد. بعلاوه این داده‌ها فاقد شِما هستند.

3- سرعت رشد داده یا Velocity: در بسیاری از کاربردها، سرعت تولید داده­‌ها، از حجم داده­‌ها مهم­تر است. اطلاعات بی­ درنگ موجب می­‌شود تا سرعت عمل، عامل سوددهی یک شرکت و سبقت از شرکت­‌های رقیب باشد.

4- ارزش داده یا Value: پیش از تصمیم­‌گیری برای ذخیره داده­‌های عظیم، باید مشخص گردد که آیا این داده ­ها ارزشمند هستند و پردازش، تحلیل یا حتی فروش آن­ها بصورت خام، موجب درآمدزایی برای شرکت می‌شود یا خیر.

گاهی از V پنجمی نام برده می‌شود ؛
5- صحت داده یا Veracity: با رشد سریع داده‌ها از نظر حجم و تنوع، احتمال وجود داده­‌های نادرست در آن­ها نیز افزایش می‌یابد. در نتیجه اگر ورودی قابل اعتماد نباشد، نمی‌توان به اطلاعات استخراج شده از آن اعتماد کرد. در دنیای کسب­ و­کار نیز، مدیران بطور کامل به اطلاعات استخراج شده از داده‌های عظیم، اعتماد نمی ­کنند.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *