کلان داده برای توصیف حجم بالایی از دادهها به کار برده میشود که مدیریت آنها بسیار دشوار است و کسبوکارها را با چالش مواجه میکند. این دادهها ممکن است دارای ساختار مشخصی باشند یا بدون ساختار خاص باشند. بیگ دیتاها بهمنظور بهبود تصمیمهای اخذ شده در شرکت و بهکاربردن استراتژیهای تجاری مورد تجزیهوتحلیل قرار میگیرند.
مجموعهای از دادههای بسیار بزرگ و پیچیده که از منابع جدید دریافت میشوند و پردازش آنها با روشهای سنتی تقریبا غیرممکن است، عبارتی دیگر برای تعریف کلان داده است.
تعریف کلان داده با مثال
برای اینکه راحتتر با مفهوم کلان داده کتاب آشنا شوید، به ارائه چند مثال کوتاه درباره آن و تاکید بر اهمیت استفاده از آن میپردازیم.
- طبق آماری که از فیسبوک (meta) بهدستآمده، روزانه بیش از 500 ترابایت داده وارد پایگاهدادههای این شرکت میشود که بیشتر آپلود عکس، فیلم، درج متن و غیره را در برمیگیرد.
- یک موتور جت در هر پرواز خود بیش از 10 ترابایت داده جدید را تنها در 30 دقیقه پرواز به پایگاه اطلاعات ارسال میکند. حال باتوجهبه پرواز هزاران جت در روز باید از کلان دادهها برای پردازش اطلاعات آنها استفاده کرد.
- روزانه در بورس نیویورک نیز حدود 1 ترابایت داده جدید تولید میشود.
از کلان داده چگونه استفاده میشود؟
به دلیل اینکه هر کلان داده و هوش مصنوعی تحول زیادی در صنایع به وجود آورده، هر یک مدیران یک استراتژی خاص برای استفاده و تحلیل آن به کار گرفته است. به دلیل اینکه تحلیل کلان داده در هر لحظه تکامل مییابد، نمونههایی را برای آگاهی بیشتر شما به اشتراک میگذاریم.
-
مدیریت و حفظ مشتری
برای تحقق این امر انواع برای دادههای مربوط به مشتریان ارائه میشود که به پیادهسازی دادههای بزرگ میپردازد نتیجه خیرهکنندهای به دنبال دارد. تجزیهوتحلیل و سادهسازی در این بخش برای موارد زیر کاربرد دارد:
- تغییر استراتژی مربوط به قیمتگذاری کالا
- بررسی میزان کیفیت خدمات و رضایت مشتری
- یافتن روشهای موثر در برخورد با مشتری
- افزایش عملکرد مدیران در تامین کالا و بالابردن ارزش مشتری
- جذب مشتریان جدید و حفظ مشتریان قدیمی
- ارائه تجزیهوتحلیل دقیق
- دستهبندی مشتریان با کمک دادههای آنها
-
مدیریت ضایعات
با کمک Big Data میزان بالایی از دقت به هوش تجاری داده میشود که با کمک آن میتوان تصمیمات علمی و آگاهانهای برای مدیریت در زباله اخذ کرد. با اعمال این تصمیمات حجم کمتری از ضایعات توسط تجارت شما تولید میشود. البته برای انجام این کار به نکتههای زیر دقت کنید.
- نوع داده مورد اندازهگیری را مشخص نمایید (این داده میتواند شامل سوخت، زمان و… باشد).
- در مراحل مختلف به اندازهگیری مواد موردنظر بپردازید (سعی کنید در نقاط بیشتری اندازهگیری کنید زیرا دادههای باکیفیتتری به شما ارائه میدهد).
- برای تجزیهوتحلیل دادهها از برنامه و کارشناسان مناسب استفاده کنید.
- با اطلاعات بهدستآمده، تنظیمات موردنیاز برای کاهش ضایعات را اعمال کنید (این امر با نصب دستگاه و سایر روشها امکانپذیر است).
-
فرایند تولید
برای افزایش دقت در تولید بهتر است تجزیهوتحلیل دادههای بزرگ استفاده کنید. با استفاده از تحلیل کلان داده، بین شرکتها در خط تولید رقابت بیشتری به وجود آمده است؛ زیرا باتوجهبه پیشبینیهایی که انجام میگیرد دیگر نیازی نیست آزمایشهای زیادی انجام گیرد و بهراحتی محصول موردنظر را تهیه میکنند. در شرکتهای بزرگ با انجام این کار از صرف میلیونها دلار هزینه جلوگیری میشود. شرکتهای کوچک نیز میتوانند با تجزیهوتحلیل دادهها به پیشرفت و گسترش شرکت خود کمک کنند. از بیگ داده میتوان در موارد زیر استفاده کرد.
- تولید محصولات سفارشی
- سنجش کیفیت قطعات و مواد
- پیشبینی، شبیهسازی و انجام آزمایش محصول جدید
- بهبود عملکرد در مصرف انرژی
- سنجش و بهبود عملکرد عوامل تامینکننده مواد اولیه
- کاهش ریسک تامین مواد اولیه
- سنجش کیفیت محصول
-
توسعه محصولات
به دلیل اینکه در توسعه محصولات باید دادههای بزرگ و پیچیده را تجزیه و بررسی کرد، استفاده از دادههای بزرگ سود زیادی به صاحبان کسبوکار میرساند. با کمک این فرایند، پیش از ارائه یک محصول به بازار همه موارد از جمله تعیین قیمت، میزان استقبال مشتری و… پیشبینی میشود. در این بخش باید به پرسشهای زیر پاسخ داده شود.
- روند پیش روی بازار چگونه است؟
- قیمت رقبا چقدر است؟
- نقاط ضعف محصولات رقبا چیست؟
- هدف محصول شما بهبود کدام نقطهضعف است؟
- ارائه کدام خدمات مشتری بیشتری جذب میکند؟
با تحلیل کلان داده شهر فناوران بهراحتی میتوان به پرسشهای مطرح شده پاسخ داد و بهترین محصول را به بازار ارائه داد. این دادههای اولیه را میتوان از نظرسنجی مشتریها، وبلاگ بازاریابی و غیره جمعآوری کرد.
-
مدیریت استعدادیابی و استخدام
منابع انسانی یکی از مهمترین فاکتورها در پیشرفت کار است که باید در انتخاب آن دقت لازم را به خرج داد. با کمک تحلیل دادهها میتوان بهترین ویژگی را برای افرادی که میخواهند استخدام شوند در نظر گرفت. انواع دادهها در این بخش را میتوان بهصورت زیر در نظر گرفت.
- بهوجودآمدن تاخیر و تولید محصول یا تحویل آن
- غیبت یکی از کارمندان
- تخمین نرخ خطاهای احتمالی
- حجم کار و سطح مهارت کارمند
- پاداش و جریمه کارمند
- درآمد حاصل از عملکرد هر کارمند
- دادههای حاصل از شش سیگما
استفاده از دادههای بزرگ در این بخش مزایای زیادی از جمله پیداکردن نقاط ضعف، یافتن استعداد مناسب برای انجام هر کار، درک توانایی هر کارمند و غیره دارد.
مزایای کلان داده
کلان داده در بخشهای مختلف دارای مزایای زیادی است اما از برجستهترین مزایای آن میتوان به این صورت نام برد:
- آشنایی با روتین خرید افراد
- بازاریابی خارج از سازمان
- کمک به پیداکردن مشتری جدید
- یافتن روش مناسب برای بهینهسازی سوخت در شرکتهای حملونقل
- نظارت دقیق بر وضعیت سلامت افراد
- ارائه نقشه دقیق راه برای وسایل حملونقل خودکار
- ارائه لحظهای از موجودی انبار
- ارائه برنامههای مراقبتی برای بیماران خاص
- نظارت بر امنیت سایبری سازمان
بزرگترین منابع کلان داده
حال که با مفهوم کلان داده و برخی از ویژگیهای آن آشنا شدید، نوبت به آن رسیده که با منابع به آوردن آن نیز آشنا شوید تا در بهدستآوردن دادههای قدرتمند به شما کمک کند. این منابع را بهصورت موردی معرفی خواهیم کرد.
-
رسانه
به دلیل اینکه افراد در رسانه بیشتر درباره تمایلات و سلیقه خود صحبت میکنند بهعنوان یکی از منابع محبوب و پرطرفدار برای دادههای بزرگ شناخته میشود. ازآنجاییکه این اطلاعات توسط خود افراد منتشر میشوند، اطلاعات مفیدی را در کوتاهترین زمان در اختیار کسبوکارها قرار میدهد. از جمله این رسانهها میتوان به گوگل، توییتر، اینستاگرام و سایر رسانههای عمومی که به کاربر اجازه میدهند فیلم، عکس و متن منتشر کنند اشاره کرد.
-
فضای ابری
امروزه فضای ابری به بهترین مکان برای ذخیره اطلاعات افراد و شرکتها تبدیل شده است. با استفاده از این فضا، دادهها بهراحتی در اختیار شرکتها قرار میگیرند. به دلیل اینکه این فضا بسیار انعطافپذیر است و انواع دادهها را در خود جای میدهد، میتوان از فضای عمومی و خصوصی آن برای ذخیرهسازی اطلاعات استفاده کرد. شرکتها تنها امکان استفاده از اطلاعات موجود در فضای عمومی را دارند و از آنها اطلاعات مفیدی کسب میکنند.
-
وب
یکی از منابع در دسترس برای کسب داده اولیه، وب عمومی است. اطلاعات موجود در این فضا به طور یکسان در اختیار همه شرکتها قرار میگیرد و بسته به نوع پردازش آنها اطلاعات مفید و کارآمد در اختیار آنها قرار میدهد. از طرفی استفاده از این منابع برای استارتآپها و SME ها مفید است زیرا نیازی نیست راهی دشوار برای رسیدن به منابع big data طی کنند.
-
اینترنت اشیا
به دلیل اینکه محتواهایی که توسط IOT تولید میشوند از حسگرهای متصل به دستگاه الکترونیک ساخته میشوند، اطلاعات دقیقتری را در زمان واقعی تولید میکنند. اینترنت اشیا دادههای بزرگ حاصل از رایانه، گوشی و همه دستگاههایی که قابلیت انتشار اطلاعات دارند را شامل میشود. دستگاههای پزشکی، بازیهای ویدئویی، دوربین و… از جمله منابع کسب اینترنت اشیا است.
-
پایگاهداده
این امکان وجود دارد که اطلاعات را از ترکیب پایگاههای سنتی و مدرن به دست آورد و با انجام این کار برای داشتن یک مدل از دادههای ترکیبی هزینه کمتری پرداخت کرد. اطلاعات حاصل از این منابع برای چندین هدف هوش تجاری نیز مورداستفاده قرار میگیرند و در نهایت زمینه مناسب برای داشتن کسبوکار بهتر را فراهم میکند. برخی از پرطرفدارترین منابع عبارتاند از MS Access، DB2، Oracle، SQL و Amazon Simple.
نکات کلیدی استفاده از کلان داده
استفاده از کلان دادهها بسیار راحت است اما درصورتیکه با نکات کلیدی نحوه استفاده از آنها آشنا باشید. 5 مورد از مهمترین نکتههایی که باید حتما رعایت کنید را در ادامه شرح میدهیم.
-
تحلیل رفتار مشتری در خردهفروشی
راههای زیادی از جمله تحلیل داده بهدستآمده از موبایل، رسانه، فروشگاه و… وجود دارد که با استفاده از آنها میتوان برای درآمد بیشتر و جلوگیری از ریزش مشتری جلوگیری کرد. وقتی همه دادهها باهم جمع میشوند و مورد بررسی قرار میگیرند، میتوان از آنها نتایج بسیار مفیدی مانند مشخصکردن مشتریهای سودآور، روش مناسب جذب مشتری با صرف هزینه پایین و… به دست آورد. به بیان ساده با کمک این علم، در ابتدا مشتری جذب میکنید سپس یک مشتری معمولی را به مشتری سودآور و دائمی تبدیل میکنید.
-
شخصیسازی تجربه با استفاده از داده بزرگ در خردهفروشی
تا مدتی پیش تجارت به روش هنری انجام میگرفت و هیچ شیوه خاصی برای آن تعریف نشده بود. با رونق فروش آنلاین محصولات، روشهای جدیدی برای نحوه صحیح تجارت شناخته شد. این روشها و فناوری جدید به تحلیل رفتار مشتریان و نحوه گسترش فروشگاهها کمک کرد. پلتفرم مهندسی داده بزرگ به خردهفروشان در شخصیسازی تجربه و بهینهسازی روشهای تجاری به آنها در فروشگاه کمک میکند.
افراد با کمک این برنامه میتوانند پیشنهادها بهموقع به مشتریان خود ارائه دهند تا میزان فروش خود را افزایش دهند. اطلاعات موردنیاز را میتوان از وبسایت، سیستم فروش، نرمافزارهای موبایل، دوربینهای داخل فروشگاه وغیره به دست آورد. با کمک پلتفرم مهندسی میتوان موارد زیر را بررسی کرد:
- میزان تاثیر تاکتیکهای به کار گرفته
- اطلاع از تاریخ فروش محصولات برای مشخصشدن نوع نیاز و علایق مشتریان
- نظارت بر نحوه رفتار مشتریان و تشویق آنها برای خریدهای آتی از شما
-
بالارفتن نرخ تبدیل با استفاده از تجزیهوتحلیل و تبلیغ
درصورتیکه دید درستی نسبت به مشتریان خود داشته باشید، قادر خواهید بود که با تبلیغات هدفمند مشتریان خاص خود را جذب کنید. این نکته را باید به یاد داشته باشید که افراد از طریق رسانههای اجتماعی بیشتر با یکدیگر تعامل دارند به همین دلیل شما میتوانید اطلاعات لازم را با استفاده از این تعاملات به دست آورده و بینش دقیقی نسبت به مشتریان به دست آورید.
مهندسی داده بین تاریخچه خرید، اطلاعات و رفتار مشتریان همبستگی ایجاد میکند که با استفاده از آن میتوان درک و اطلاعات پیچیده و غیرمنتظرهای به دست آورد. خدماتی که مهندسی داده به خردهفروشان ارائه میکند:
- بررسی میزان تاثیر روشهای تبلیغاتی
- اطلاع از تاریخچه خرید مشتریان برای کشف اطلاعات فروش
- نظارت بر رفتار مشتریان و ارائه پیشنهاد خرید به آنها
-
تجزیهوتحلیل سفر مشتری
به دلیل گستردگی فضای مجازی مشتریان قادرند بهراحتی یک محصول را در نقاط مختلف پیدا کرده و باهم مقایسه کنند که این امر انتظار مشتریان را از فروشندگان بالاتر برده است. درصورتیکه شما این روند را زیر نظر بگیرید، بهراحتی میتوانید نحوه بینش خود را با مشتریان تطبیق داده و درک درستی از سفر هر مشتری در کانالها و پیجهای مختلف به دست آورید.
به کمک مهندسی داده همه دادههای بدون ساختار و ساختاریافته (Hadoop) را به دست آورده و تجزیه کنید. نتیجه بهدستآمده از این دادهها درک جدیدی از مطالب به شما میدهد و پاسخ سوالات پیچیده مربوط به خردهفروشی که نمونههایی از آنها را در ادامه ذکر کردهایم پیدا کنید.
- در مراحل سفر مشتری چه اتفاقی رخ میدهد؟
- مشتریان سودآور و رفتار آنها را کدام است؟
- کدام روش دسترسی به آنها بهتر است؟
-
تجزیهوتحلیل عملیاتی و زنجیره تامین
استفاده از پلتفرم مهندسی برای بازکردن دید خردهفروشان را نسبت به اطلاعات مخفی موجود در گزارشها باز میکند. این اطلاعات شامل الگوها و روندهایی است که تاکنون به ذهن تجار نرسیده است و در مخارج آنها صرفهجویی میکند. این دادهها از ماشینهای خط تولید، سرورها، وسایل مشتریان، گزارش هر محصول و… به دست میآید که جمعآوری آن توسط انسان امری بسیار دشوار است. این دادهها باگذشت زمان حجم بیشتری به خود اختصاص داده و پیچیدهتر میشوند.
CRM، ERP، Mainframe، داده عمومی و داده مکانی از جمله اطلاعات سازمانیافتهاند که با دادههای بدون ساختار ترکیب میشوند و به یافتن اطلاعاتی از جمله نقاط پرت کمک میکنند.
مهارت موردنیاز برای استفاده از کلان دادهها
-
مهارت تحلیل داده
برای تبدیلشدن به یک تحلیلگر باید ریاضیات شما قوی باشد و علم داده را بشناسید سپس از ابزار تجزیهوتحلیل استفاده کنید.
-
مهارت تجسم داده
به دلیل اینکه برای ارسال پیام خاص باید دادهها بهاندازه آماده شوند، باید از قوه تجسم خوبی برخوردار باشید. اگر این مهارت را بهصورت ذاتی ندارید، با استفاده از نرمافزارهای مناسب برای یادگیری آن اقدام کنید.
-
آشنایی با زمینه تجاری و ابزار داده بزرگ
برای اینکه درک بهتری نسبت به اطلاعات بهدستآمده توسط بیگ دیتا داشته باشید، باید نسبت به زمینه تجاری موردنظر آشنایی داشته باشید.
-
مهارت برنامهنویسی
از جمله مزیتهای Big Data Professional بهدستآوردن دانش در زمینه سی، جاوا، پایتون و… است که یکی از معیارها برای استخدام در شغل بررسی داده بزرگ است. برای حرفهای شدن باید بهصورت اصولی با الگوریتمها، زبان شی، دادهها، کدگذاری، تحلیل دادهها و… آشنا باشید. مهارت درباره پایگاهداده، ریاضی، تفکر منطقی و… نیز در این زمینه شما را به یک فرد حرفهای مبدل میکند.
-
مهارت حل مسئله
به دلیل پیچیده بودن دادههای بزرگ بهخصوص دادههای بدون ساختار، برخوردار بودن از توانایی حل مسئله جز مهارتهای مهم است. در کنار آن داشتن خلاقیت نیز کمک ویژهای به شما میکند.
-
زبان پرسوجو ساختاریافته SQL
SQL بنیان داده بزرگ است و با استفاده از داده کار میکند. داشتن اطلاعات لازم درباره این زبان بسیار مفید خواهد بود.
-
مهارت دادهکاوی
یادگیری مهارت داده کاوی با استفاده از ابزار پیشرفته مانند KNIME، َApache، Mahout و… باعث میشود که طرفداران زیادی برای استخدام در شرکتهای مختلف پیدا کنید.
-
آشنایی با فناوریها
متخصصانی که در زمینه داده بزرگ فعالیت میکنند باید با انواع فناوریها آشنا باشند تا در تجزیهوتحلیل و نتیجهگیری از آنها استفاده کنند. کارکردن با Linux، Hadoop، Scala و… مهارت شما را بالا میبرد.
-
آشنایی با ابرهای عمومی و ترکیبی
بیشتر شرکتهای بزرگ برای دسترسی دائم به دادهها، صرف هزینه کم و امنیت اطلاعات از فضای ابری برای ذخیرهسازی اطلاعات استفاده میکنند. حتی استفاده از ابر ترکیبی نیز یک عمل جدیدتر است که میتوان دادهها را داخل یا روی آن ذخیرهسازی کرد. برخی از ابرهای عبارتاند از AWS، Microsoft Azure و… و تعدادی از ابرهای داخلی عبارتاند از OpenStack، Vagrant، Kubernetes و…
-
مهارت بهدستآمده از تجربه علمی
داشتن تجربه علمی و گذراندن دورههای آموزشی باعث میشود که درک بهتری از دادهها داشته باشید و از نتایج نهایی اطلاعات بهتری به دست آورید.
مشخصههای داده بزرگ
یک کلان داده کتاب باید تعدادی ویژگی برجسته داشته باشد تا بتوان آن را بهعنوان یک داده قدرتمند شناخت. این ویژگی شامل موارد زیر است.
- سرعت
- تنوع
- توسعهپذیری
- قابلیت بصریسازی
- اعتبار
- ارزش
- حجم
معماری کلان داده
معماری داده بزرگ باید ویژگیهای زیر یا حداقل برخی از آنها را داشته باشد:
- باید همه دادهها و راهحلهای مورداستفاده در آن، یک منبع مشخص داشته باشند مانند ذخیرهسازی، فایل تولیدی توسط برنامهها و…
- برای اینکه بتوان دادهها را بهصورت دستهای پردازش کرد باید در فروشگاه فایل توزیعشده ذخیرهسازی شوند که به آن دریاچه داده گفته میشود.
- کلان داده شهر فناوران باید با کارهای دستهای طولانیمدت به پردازش فایلهای بپردازد و آنها را برای تجزیهوتحلیل آماده کند. خواندن فایل، پردازش و ارائه خروجی، کار ذکر شده را تشکیل میدهند.
- اگر برای پیداکردن راهحل از منبع بی درگ استفاده شود، معمار باید راهی برای ذخیرهسازی آن پیدا کند که این راه میتواند فروشگاه داده باشد. راهحل شما هرچه باشد به یک محل ذخیرهسازی برای پشتیبانی از دادهها نیاز دارید.
- در صورت دریافت پیام بلادرنگ باید راهحل با استفاده از فیلترکردن یا تجمیع یا درنهایت آمادهسازی آنها برای بررسی، پردازش کند. این جریان پردازش طبق پرسوجوی SQL به طور مداوم در حال اجرا شدن است.
- راهحلهای زیادی برای داده بزرگ وجود دارد که بسیاری از آنها دادهها را برای تجزیهوتحلیل آماده میکنند و بهصورت یک داده ساختاریافته در اختیار افراد قرار میدهند. استفاده از انبار داده به روش کیمبال و فناوری NoSQL با تاخیر کم از جمله روشها برای ذخیرهسازی و ارائه اطلاعات باشد.
- ارائه یک درک درست از داده موجود، هدف بیشتر راهحل دادههای بزرگ است. برای معماری میتوان از مکعب OLAP، داده جدولی و سایر روشها استفاده کرد.
- پردازش منظم دادهها، کپسوله شدن طی عملیات، تبدیل داده، جابهجایی داده بین منبع و سینکهای مختلف، آپلود داده پردازش شده در ذخیرهساز و انتقال نتیجه به داشبورد مراحلی است که راهحلهای داده بزرگ آن را طی میکنند. برای اتوماتیک شدن این پروسه میتوانید از فناوریهایی چون AZURE Data استفاده کنید. این نوع فناوری به دودسته خدمات مدیریت شده و فناوری منبعباز بر پایه Apacha Hadoop تقسیم میشود.
تجزیهوتحلیل دادههای بزرگ
استفاده از شیوههای تحلیلی پیشرفته برای دادههای بزرگ که انواع داده بدون ساختار و ساختاریافته را در بر میگیرد، تجزیهوتحلیل دادههای بزرگ نامیده میشود. با کمک این روش میتوان از دادههای غیرقابلفهم و دور از دسترس، اطلاعات مهمی برای اخذ تصمیمات شرکت کسب کرد.
بهترین ابزار برای دادههای بزرگ
امروزه ابزار زیادی برای تجزیهوتحلیل دادهها وجود دارد که در ادامه به معرفی برخی از برترین نرمافزارهای و ابزار و امکانات آنها میپردازیم.
-
هادوپ
- بهبود وضعیت احراز هویت حین استفاده از پروکسی HTTP
- سازگاری مشخصات با فایل Hadoop
- پشتیبانی از فایلهای POSIX
- ارائه اکوسیستم قدرتمند برای پاسخ به نیاز تحلیلی کاربر
- انعطافپذیری بالا در پردازش انواع داده
- پردازش دادهها با سرعت بالاتر
-
Atlas.ti
- صدور اطلاعات هر منبع
- یکپارچهسازی دادهها
- تغییر نام کد در حاشیه
- مدیریت انواع اسناد با داده کدگذاری شده
-
HPCC
- انجاموظیفه داده بزرگ با کد کمتر
- بالا بودن سطح دسترسی به دادهها
- پردازش پیچیدهترین دادهها در خوشه Thor
- ارائه IDE جهت ساده شدن آزمایش، توسعه و رفع اشکال
- بهینهسازی اتوماتیک پردازشهای موازی
- بالا بودن میزان عملکرد و پذیرش مقیاس
- قابلگسترش با کتابخانه C++
- بهینه شدن کامپال ECL در C++
شرکتهای کلان داده
طی فرایند داده بزرگ یک مجموعه از تعداد زیادی داده پیچیده به اطلاعات قابلفهم و مفید تبدیل میشود به همین دلیل در دنیای امروز بسیار مورداستفاده قرار میگیرد. در ادامه برخی از شرکتهای مهم در بیگ دیتا را معرفی میکنیم.
- کلاویو
- سنترفیلد
- کلودرا
- آلتریکس
- DISQO
- FOURKITES
- IBM
- Reonomy
- گوگل
- بینش CB
مرکز داده NSA در یوتا
مساحت مرکز NSA که در زمینه کلان داده و اینترنت اشیا فعالیت دارد، بیش از 1 میلیون فوت مربع است که در یوتا قرار دارد و برای ساخت آن مبلغی حدود 1.5 میلیارد دلار صرف شده است.
این مرکز به ذخیرهسازی تمام اطلاعات دریافتی از ایمیلی، وبگردی، تماس تلفنی و دادههای عمومی دیگر میپردازد. این مرکز که بزرگترین فضای برای ذخیره اطلاعات را در اختیار دارد، قسمتی از آژانس امنیت ملی بهحساب میآید.
بامبو هیو اسم رمز این شرکت است دارای بیش از 20 ساختمان است که مساحت هرکدام از 1 میلیون فوت مربع بزرگتر است. گفته شده که همچنان ظرفیت از مخزن در حال افزایش است و ابررایانه موجود در آن که آبشار نام دارد، قادر است 1017 محاسبه در ثانیه انجام دهد.
درآمد مهندس کلان داده
افرادی که وارد این شغل کلان داده در ایران میشوند جز نخبهها بهحساب میآیند و از امکان دریافت دستمزد غیرقابلتصوری برخوردارند. البته در تعیین حقوق دقیق آنها عوامل مختلفی موثر است که نباید از آنها چشمپوشی کرد. از طرفی از حضور چنین افرادی در شرکتها حمایت میشود زیرا طبق مطالعه Accenture بیش از 79 درصد از مدیران عقیده دارند درصورتیکه یک شرکت از علم Big Data استفاده نکند، در مدت کوتاهی از دور رقابت خارج میشود.
کلام آخر
استفاده از کلان داده به صاحبان کسبوکار و شرکتها کمک میکند که با صرف هزینه کمتری، دادههای بیشتری را مورد تحلیل و بررسی قرار دهند و اطلاعات دقیقی به دست آورند.
دردستداشتن اطلاعات دقیق به مدیران در اخذ تصمیمات کارآمد و بهتر کمک میکند؛ اما برای آشنا شدن با تعریف کلان داده و آشنایی با ویژگیهای آن باید اطلاعات کافی از یک منبع قابلاطمینان به دست آورید. از آن جایی که کلان داده در ایران نیز مورد استفاده قرار میگیرد، احتمالا این مطالب همان چیزی است که شما به دنبال آن میگردید.