داده کاوی اینترنت اشیاء بر اساس بستر رایانش ابری
- 1400/5/18
- 1471
- سایر مقاله ها
مسائل کلیدی داده کاوی اینترنت اشیاء
امروزه کسی گمان نمی کرد که الگوی محاسبات ابری جهانی 3A به بازار اینترنت اشیا ادامه پیدا کند. اینترنت اشیاء در حال حاضر کانون توسعه فناوری اینترنت است. این مقاله مسیر جدیدی از داده کاوی برای اینترنت اشیاء را بر اساس پلت فرم رایانش ابری مورد بحث قرار می دهد.
همانطور که دستگاه های اینترنت اشیا حجم زیادی از داده های ساختار یافته و بدون ساختار را از حس گرها جمع آوری می کنند ، با چالش پردازش و نگاشت این داده ها در زمان واقعی رو به رو می شوند، جایی که داده های بزرگ وارد می شوند. داده های بزرگ و اینترنت اشیا هم زیست هستند. در این رابطه هم زیستی ، اتصال یکپارچه IoT و به دنبال آن جمع آوری و تجزیه و تحلیل داده های بزرگ می تواند به شرکت ها کمک کند تا درک بالاتری از رشد آینده خود داشته باشند. اینترنت اشیاء یکی از جدیدترین تحولات دهه گذشته است که با موفقیت ادغام فناوری و داده ها برای توسعه استراتژی های سازنده تر است. با افزایش سنسورها و دستگاه های هوشمند در دهه گذشته، پردازش دقیق مقادیر زیادی از داده های فرکانس بالا برای سازمان ها بسیار مهم است. در این جهان به هم پیوسته، یک روش داده کاوی اینترنت اشیا که بینش های کسب و کار را جذب، تحلیل و ضبط می کند، نیاز و استراتژی مناسب در حال حاضر است.
ویژگی های داده ها در سیستم اینترنت اشیاء
هر سیستم اینترنت اشیا دارای هزاران دستگاه یا بیشتر است که به طور مداوم داده های جمع آوری شده را به مرکز داده منتقل می کند. مرکز داده نه تنها باید داده های جمع آوری شده را ذخیره کند ، بلکه باید داده های تاریخی را برای پشتیبانی از ردیابی وضعیت، تجزیه و تحلیل آماری داده ها و داده کاوی شیء ذخیره کند. بنابراین، اولین مشکل کلیدی داده کاوی در سیستم اینترنت اشیاء ، حجم زیاد داده ها است.
سیستم اینترنت اشیا طیف گسترده ای از اشیاء، از جمله حمل و نقل، زیست شناسی، جنگل، معماری و غیره را زیر نظر دارد. اطلاعات جمع آوری شده توسط اجسام مختلف نظارتی متفاوت است. به عنوان مثال، اطلاعات ویدئویی باید در سیستم ترافیک جمع آوری شوند، سیستم نظارت پزشکی باید اطلاعات فیزیولوژیکی مانند نبض، فشار خون و اطلاعات تأثیر استریوسکوپی پزشکی را جمع آوری کند. مشاهده می شود که انواع داده های جمع آوری شده توسط سیستم اینترنت اشیا از جمله نوع متن، نوع تصویر، نوع فیلم پیچیده هستند،
داده ها ناهمگن هستند: سیستم اینترنت اشیاء شامل انواع پایانه های سنجش، مانند پایانه های حس گر GPS، پایانه های حس گر RFID، پایانه های تشخیص ویدئو، سنسورهای بی سیم و پایانه های حسگر مختلف است.
قالب و معنا شناسی داده ها متفاوت است: ناهمگونی داده ها ، مشکل ذخیره و استخراج داده ها را افزایش می دهد.
بسیار پویا: در هر لحظه پایانه های حس گر مختلف به اینترنت اشیاء اضافه یا از اینترنت حذف می شوند. با افزایش گره حس گر، اطلاعات جمع آوری شده به پایگاه داده وارد می شود. به طور مشابه، هنگامی که یک گره حس گر از اینترنت اشیا حذف می شود ، پایگاه داده دیگر نباید داده های جمع آوری شده توسط گره حس گر را ثبت کند. یک سیستم iot شامل تعداد زیادی گره حس گر است و هر گره حس گر اغلب به صورت پویا تغییر می کند، بنابراین داده ها در سیستم iot بسیار پویا هستند.
ویژگی های زمانی و مکانی: پایانه های حس گر سیستم اینترنت اشیاء در مناطق مختلف توزیع شده اند و داده های جمع آوری شده توسط هر پایانه سنسور باید وضعیت و سایر اطلاعات شی را در هر زمان کنترل کند. داده های درک شده در یک زمان و مکان خاص معنی دار هستند و اگر در این زمان یا بیشتر از این زمان نباشد، ممکن است معنی داده ها کوچک باشد. بنابراین ، ویژگی های پیچیده مکانی و زمانی ویژگی قابل توجهی از داده ها در سیستم اینترنت اشیا هستند.
ناقص: پایانه سنجش سیستم اینترنت اشیاء بدون نظارت مصنوعی کار می کند. هر پایانه سنجش ممکن است در هر زمان مورد حمله عوامل طبیعی یا انسانی قرار گیرد ، از جمله صاعقه ، صدمات مخرب مصنوعی و غیره ، که منجر به دریافت ناقص داده ها از پایانه سنجش می شود. از سوی دیگر ، اگرچه پایانه های حسگر می توانند به طور گسترده در مکان های مختلف جغرافیایی مستقر شوند ، اما هنوز نمی توانند هر گوشه ای را پوشش دهند ، بنابراین جمع آوری ناقص داده های فضایی نیز یکی از ویژگی های داده های سیستم اینترنت اشیاء است.
الزامات اینترنت اشیا برای داده کاوی
داده کاوی در زمان واقعی و کارآمد: هرگونه کنترل انتهایی سیستم اینترنت اشیاء نیاز به تجزیه و تحلیل محیط در زمان واقعی و تصمیم گیری صحیح دارد. بنابراین، زمان واقعی و کارآمد یکی از ضروری ترین الزامات برای داده کاوی در سیستم اینترنت اشیاء است.
داده کاوی توزیع شده : اینترنت اشیاء برای محاسبه تجهیزات و توزیع طبیعی داده ها باید از داده کاوی موازی توزیع شده استفاده کنند.
کنترل کیفیت داده ها: ذخیره و مدیریت داده های چند منبع، چند حالته، چند رسانه ای و چند قالب ضمانت مهمی برای کنترل کیفیت داده ها و دستیابی به نتایج واقعی است.
کنترل تصمیم : شامل الگوها، قوانین، شاخص های ویژگی برای پیش بینی، تصمیم گیری و کنترل است.
وظایف استخراج : عمدتاً شامل استخراج داده ها، پیش بینی طبقه بندی، خوشه بندی، کشف قوانین ارتباط و غیره است.
چالش های استخراج داده های محیطی اینترنت اشیاء: الگوریتم مناسب را انتخاب کرده و استراتژی موازی مناسب را پیش از بهبود کارآیی موازی اتخاذ کنید. بنابراین، طراحی الگوریتم بسیار مهم می شود، تنظیم پارامترها ضروری می شود و تنظیم پارامترها به طور مستقیم بر نتایج نهایی تأثیر می گذارد.
عدم قطعیت: اولاً، شرح وظایف داده کاوی نامشخص است و به دست آوردن و پیش پردازش داده ها نیز نا مشخص است. دوم عدم قطعیت روش ها و نتایج داده کاوی است. سرانجام ، با توجه به اهداف نهایی مختلف استخراج که هر کاربر به آن توجه می کند، این امر منجر به عدم قطعیت در ارزیابی نتایج معدن می شود. عدم قطعیت بزرگترین چالش برای داده کاوی در سیستم اینترنت اشیا است.
اعتبار و امنیت: داده کاوی در محیط محاسبات ابری منجر به اعتبار نرم افزار سرویس داده کاوی داده می شود. اولین مورد صحت خدمات و امنیت سرویس است، دوم کیفیت خدمات است که با سه عملکرد در دسترس بودن، قابلیت اطمینان و عملکرد بالا اندازه گیری می شود.
مروری بر فناوری بستر رایانش ابری
اصطلاحاً بستر رایانش ابری، به روش محاسبه مبتنی بر فناوری اینترنت اشاره دارد. این فناوری در فرآیند پیاده سازی اغلب خدمات محاسباتی مربوطه را از طریق خدمات ناهمگن و خود مختار اینترنتی به کاربران ارائه می دهد. از آن جا که تمام فرایند خدمات و نتایج مربوط به قدرت اینترنتی است، این روش محاسبه به عنوان فناوری محاسبات ابری نامیده می شود که رایانش ابری به استفاده از اینترنت برای ارائه خدمات به کاربران برای مجازی سازی مقیاس پذیر پویا از مدل محاسبات اشاره دارد.
مدل داده کاوی اینترنت اشیاء بر اساس محاسبات ابری
معماری مدل داده کاوی مبتنی بر رایانش ابری به پنج لایه تقسیم می شود: لایه دسترسی به اطلاعات اینترنت اشیاء، لایه ادغام داده ها، لایه بستر داده کاوی، لایه کنترل کسب و کار و لایه تعامل.
ماژول لایه دسترسی به داده اینترنت اشیاء ماژول محاسبه sea: ماژول محاسبات sea شامل تعداد زیادی گره محاسبات sea است. عمدتا برای ذخیره انواع داده های جمع آوری شده توسط ترمینال سنسور و پیش پردازش داده ها، از جمله حذف داده های نویز و تکرار داده ها، پردازش داده های ناقص، شناسایی و استخراج داده های کلیدی و یکپارچه سازی قالب داده ها استفاده می شود. در نهایت، داده های کلیدی از پیش پردازش شده به لایه یکپارچه سازی داده ها منتقل می شوند. پیش پردازش داده ها در لایه دسترسی به داده ها در اینترنت چیزهایی برای صرفه جویی در پهنای باند شبکه و ذخیره و استفاده بیشتر از لایه یکپارچه سازی داده مفید است.
ماژول الگوریتم داده کاوی موازی: الگوریتم های موازی را برای کارهای مختلف داده کاوی ارائه می دهد. به عنوان یک موتور داده کاوی، شامل یک کتابخانه است که می تواند الگوریتم های مختلف داده کاوی موازی را بر اساس محاسبات ابری ارائه دهد، که می تواند برای تکمیل کارهای مختلف داده کاوی مورد استفاده قرار گیرد.
ماژول ETL موازی: پیش پردازش داده ها داده های ورودی از پایگاه داده توزیع شده زمانی و انبار داده ها با محوریت اینترنت اشیاء تهیه می شود که داده ها را برای فرآیند داده کاوی پاک، استخراج، تبدیل و بارگذاری می کند.
ماژول ارزیابی مدل: مدل تولید شده را ارزیابی کنید. نتایجی که نیازهای کاربران را برآورده می کند در پایگاه دانش حوزه ذخیره می شود، که می تواند منطق کنترل کسب و کار را برای هدایت فرآیند داده کاوی کمک کند.
ماژول استخراج داده ها: با توجه به وظایف مختلف استخراج ، داده های مربوطه از پایگاه داده فضایی زمانی یا انبار داده های رو به اینترنت اشیاء استخراج می شود.
ماژول کنترل برنامه ریزی وظیفه: در پاسخ به ماژول کسب و کار فوقانی، مشاغل فرعی مورد نیاز برای تکمیل مشاغل فراخوانده می شود، مدیریت می شود و با فراخوانی ماژول زیر بنایی، کسب و کار تکمیل می شود.
ماژول کنترل گردش کار: با نظارت و مدیریت وضعیت کسب و کار، پارامترهای اطلاعات خاص را می توان به ماژول کنترل برنامه ریزی وظیفه این لایه برگرداند.
ماژول مدیریت کاربر: شناسایی هویت کاربر و تنظیم مجوزهای مربوطه، اما همچنین شامل ورود یا خروج کاربر و سایر مدیریت متداول است.
ماژول کسب و کار: برای دستیابی به نیازهای دقیق کسب و کار کاربر، خدمات مختلف ارائه شده توسط کاربر از طریق ماژول تجاری به دست می آید.
ماژول نمایش نتایج: برای دستیابی به کاربران برای مشاهده، تجزیه و تحلیل و ذخیره نتایج کسب و کار و سایر عملکردها و برای تحویل بازگشت سیستم به کاربر استفاده می شود.
سخن پایانی
می توان گفت داده های بزرگ، رایانش ابری و اینترنت اشیا برانگیخته ترین "three carriages" در حوزه فناوری اطلاعات هستند. از زمان تولد مفهوم ، این سه رابطه ظریف را حفظ کرده اند، که نمی توان آن ها را از یکدیگر جدا کرد، اما یکسان نیستند. رایانش ابری دارای مزایای معماری انعطاف پذیر، هزینه کم و افزایش امنیت است و در آینده دستاوردهای جدید فناوری بیشتر به چشم می خورد که این نتیجه اجتناب ناپذیر توسعه فناوری اینترنت اشیاء در بستر محاسبات ابری است.