• هرگز با احمق ها بحث نکنید.آنها اول شما را تا سطح خودشان پایین می کشند، بعد با تجربه ی یک عمر زندگی در آن سطح، شما را شکست می دهند! - مارک تواین
  • 1
  • 2
  • 3
  • 4
  • 5

Big Data چیست؟

فناوری های IT و راهکارها

 

BigData  مفهومی است که بیانگر دارایی های اطلاعاتی است  که حجم بالا، سرعت بالا، و تنوع بالایی دارند. و نیازمند استفاده از ساختارهای جدید، تکنولوژی های جدید  و  روش های تحلیلی فنی جدید برای پردازش، آنالیز و  استخراج داده های ارزشمند برای کسب و کارمی باشد.
تعریف داده بزرگ از سه جنبه اصلی بررسی می شود: ویژگی های داده ها، نیازهای پردازش داده ها، و ارزش کسب و کار.

   Big Data اصطلاحی در حال تحول می باشد که مقدار زیادی داده ی ساختار یافته، نیمه ساختار یافته و یا بدون ساختار را توصیف می نماید که قابلیت استخراج به عنوان اطلاعات را دارند. اگرچه Big Data به مقدار کمّی مشخصی اشاره نمی کند، ولی این واژه معمولا زمانی که در رابطه با داده های با حجم پتابایت یا اگزابایت صحبت می شود، کاربرد ویژه پیدا خواهد کرد .

   Big Data یک واژه ی پرکاربرد برای توصیف رشد نجومی  داده است و ممکن است همچون اینترنت، برای کسب وکار و حتی جامعه با اهمیت گردد. در واقع Big Data می تواند توسط هرشخص یا رسانه های جمعی و در هر زمان و طی هر فرآیند دیجیتال تولید شود و از طریق سیستم ها، حسگر ها و … منتقل گردد. این داده ها در سرعت، حجم و نوع های مختلف و از منابع گوناگون ارسالمی گردند، در نتیجه برای دریافت و استخراج و تحلیل آن ها نیاز به قدرت پردازش زیاد و توانایی تحلیل بالا می باشد.

  از آنجا که بارگذاری Big Data در پایگاه های داده ی عادی برای تحلیل، نیاز مند زمان و هزینه ی زیادی می باشد، رویکرد های نوین، به سمت ذخیره سازی و تحلیل داده ها با اتکای کمتر به نوع و طرح داده، حرکت کرده است. به طوری که  داده های خام در تجمیع با ابرداده ها برای یافتن الگو های مشخص،  توسط برنامه های هوش مصنوعی و با استفاده از الگوریتم های پیچیده، مورد جستجو  قرار خواهند گرفت.

Characteristics of data:  داده های بزرگ شامل مجموعه داده‌های بزرگی می‌باشد که مرکب از   داده های ساختار یافته و غیر ساخت یافته به شکل دیجیتال می باشد. به غیر از اندازه آن، داده‌ها مدام در حال تغییر می‌باشند و نیز از سورس های مختلف در حال تولید می باشد.

Data processing needs: پردازش داده ها نیاز دارد: زیر ساخت های ذخیره سای و پردازش داده‌ها توانایی مدیریت Big Data را ندارند. Bigdata نیازمند معماری بسیار مقیاس پذیر برای ذخیره سازی و همچنین پردازش داده‌ها به شکل جدید می باشد. مانند پردازش توزیع شده، پردازش موازی و هوشمند سازی ماشین ها. Bigdata  نیازمند علومی مانند آمار، ریاضیات، تجسم داده هاdata visualization، و علوم کامپیوتر برای تجزیه و تحلیل داده های بزرگ می باشد.

Business value: تجزیه و تحلیل داده بزرگ  اهمیت فوق العاده ای  برای کسب و کار سازمانها دارد. جستجو، جمع آوری، و ارجاعات مجموعه داده های بزرگ در زمان واقعی و یا زمان نزدیک به واقعی سازمانها را قادر می سازد نتایج ارزشمندتری از داده‌ها را بدست آورند.
بسیاری از سازمان ها مانند ادارات دولتی، retail خرده فروشی،telecommunications  ارتباطات از راه دور، بهداشت و درمان، شبکه های اجتماعی، بانک ها، و شرکت های بیمه  تکنیکهای علم داده‌ها را به کار می‌گیرند تا از مزایای Big Data analytics بهره مند شوند.

مشخصه های اصلی Big Data:
Big Data یا داده های عظیم بر اساس مشخصه های زیر می تواند تعریف گردد:
    حجم (Volume): مقدار داده‌های تولید شده در این زمینه بسیار مهم است. در واقع با توجه به حجم داده است که می توان گفت، Big data محسوب می شود یا خیر.
    تنوع (Variety): دومین مشخصه ی با اهمیت Big Data، تنوع می باشد. در حقیقت همین تنوع است که باعث تحلیل بهتر داده ها و حمایت کاربران از Big Data می شود. از طرفی همین مشخصه باعث می شود که داده ها به راحتی قابل ادغام با یکدیگر نباشند.
    نرخ تولید (Velocity): واژه ی “نرخ تولید” در این بحث به سرعت تولید و پردازش داده‌ ها اشاره دارد. 

 هرگونه نشر و کپی برداری بدون ذکر منبع و نام نویسنده دارای اشکال اخلاقی می باشد.

مطالب و دوره های آموزشی مرتبط
مطالب و دوره های آموزشی مرتبط
مطالب و دوره های آموزشی مرتبط

برچسب ها: Big Data, کلان داده, داده های حجیم