حقيبة تدريبية
تحليل البيانات الضخمة
Big data analysis
10 أيام، 50 ساعة تدريبية
المحاور التدريبية:
اليوم التدريبي الأول: أساسيات البيانات الضخمة
- مفهوم ونشأة البيانات الضخمة.
- آلية عمل البيانات الضخمة.
- هل كل البيانات ذات أحجام كبيرة هي بيانات ضخمة؟
- مزايا وإمكانيات البيانات الضخمة.
- مجالات استخدام البيانات الضخمة.
- تطبيقات ونماذج من واقع استخدام البيانات الضخمة.
اليوم التدريبي الثاني: البيانات الضخمة وإدارتها
- الأطراف في منظومة البيانات الضخمة
- البيانات الضخمة
- أنظمة إدارة البيانات الضخمة
اليوم التدريبي الثالث: تحليل البيانات الضخمة
- مفهوم تحليل البيانات الضخمة
- أهمية تحليل البيانات الضخمة
- أنواع تحليلات البيانات الضخمة
- أدوات وبرمجيات تحليل البيانات الضخمة
- تحديات البيانات الضخمة
اليوم التدريبي الرابع: أدوات وطرق وتقنيات المستخدمة في تحليل البيانات الضخمة
- أنواع التقنيات و قواعد البيانات المستخدمة في تحليل البيانات
- آلية عمل تحليل البيانات
- تدقيق ورقابة البيانات الضخمة
اليوم التدريبي الخامس: الذكاء الاصطناعي والبيانات الضخمة في الاستثمار الكمي
- أهمية البيانات الضخمة للذكاء الاصطناعي.
- أهمية الذكاء الاصطناعي للبيانات الضخمة.
- الاستفادة من الذكاء الاصطناعي والبيانات الضخمة في الاستثمار الكمي.
- منهجيات الذكاء الاصطناعي AI Approaches.
- استخدام الذكاء الاصطناعي والبيانات الضخمة لتحسين سلسلة التوريد.
- تأثير الذكاء الاصطناعي والبيانات الضخمة.
- ظهور الذكاء الاصطناعي والبيانات الضخمة في أدوات تصنيف الاستثمار.
اليوم التدريبي السادس: Hadoop الأداة الأكثر تأثيرًا وثباتًا في تحليل البيانات الضخمة
- نظرة عامة على هادوب
- مكونات هدوب الاساسية
- توزيعات هادوب ( Hadoop distributions )
- مزايا هادوب
- بعض الجهات التي تستخدم هادوب
- بعض المسائل التي يمكن يعالجها هدوب
اليوم التدريبي السابع: تثبيت تجمع هدوب الافتراضي
- تعريف
- انواع الافتراضية
- بعض الادوات للبيئات الافتراضية
- فوائد الافتراضية
- تثبيت VirtualBox
- تحميل وتشغيل جهاز كلوديرا الافتراضي
- تصفح مكونات هدوب
اليوم التدريبي الثامن: مابريديوس ويارن
اليوم التدريبي التاسع: معالجة البيانات الضخمة باستخدام Apache Spark
- ما هي البيانات الضخمة ولماذا نستخدم Apache Spark؟
- كيف تعمل Spark تحت الغطاء
- كيفية قراءة البيانات وكتابتها باستخدام Spark
- كيفية استخدام Spark SQL وData Frames ومجموعات البيانات
اليوم التدريبي العاشر: تابع معالجة البيانات الضخمة باستخدام Apache Spark
- كيفية استخدام Spark MLlib و GraphX وSparkR
- كيفية استخدام Spark UI وZeppelin وJupyter
- كيفية تحسين كفاءة الوظيفة وقابلية التوسع