بوابة وادي فاطمة الالكترونية
 

العودة   بوابة وادي فاطمة الالكترونية > «۩۞۩ بوابة وادي فاطمة التعليمية ۩۞۩» > العلوم التطبيقية - العلوم البحتة

العلوم التطبيقية - العلوم البحتة الهندسة - الصناعة - التقنيات - التكنولوجيا - الرياضيات - الكيمياء - الفيزياء - الفلك - الزراعة - البيطرية - علم الأرض - علم البحار - علم الحيوان - علم النبات


إضافة رد
قديم 2014-01-05, 12:26 PM   #1 (المشاركة)
إبن الراشد
«۩۞۩ عضو فعال ۩۞۩»


الصورة الرمزية إبن الراشد
إبن الراشد غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 4466
 تاريخ التسجيل :  Dec 2013
 أخر زيارة : 2018-07-04 (11:14 PM)
 المشاركات : 293 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000ie
افتراضي تحري المعطيات data mining



Bookmark and Share

يعد تحري المعطيات data mining من المفهومات الجديدة في الهندسة المعلوماتية، ظهر نتيجة التطور الكبير الذي شهده استخدام قواعد المعطيات database في النصف الثاني من تسعينات القرن العشرين، وتلازم ظهوره مع الحاجة إلى مايسمى «اكتشاف المعرفة»knowledge discovery.
أتاح تطور التقانات المعلوماتية إمكانات واسعة للتعامل مع مقادير كبيرة من المعطيات، ووفر الوسائل اللازمة لتخزينها وتعديلها واستخراج المعلومات منها لدى المؤسسات التي تستخدم الوسائل المعلوماتية ويعتمد عملها اعتماداً كبيراً على الأنظمة المعلوماتية والبيانات مثل المصارف وشركات التأمين وغيرها.
إن النمو السريع لحاجات المؤسسات وزيادة حجوم مخازن المعطيات الحديثة التي يجري تجميعها على مراحل زمنية طويلة من جهة، واختلاف طبيعة المعطيات التي يمكن تخزينها من جهة أخرى، جعل الطرق الإحصائية التقليدية قاصرة عن تحقيق كل متطلبات تحليل المعطيات، الأمر الذي استدعى تطوير طرائق جديدة تستخدم تقانات الذكاء الصنعي في تحليل ذلك الكم الهائل من المعطيات، واستخلاص مايهم المعرفة المفيدة. وأدت هذه التقانات والأدوات إلى ظهور ما سُمي اكتشاف المعرفة من قاعدة المعطياتknowledge discovery in databases (KDD) الذي عدّ فرعاً مستقلاً بذاته من فروع المعلوماتية. وقد عُقدت تحت شعاره عدّة مؤتمرات كان أولها عام1991، وصدرت مجلة خاصة بهذا العلم عام 1997 تدعى Fayyad، وأجريت بحوث عدّة في مجاله والمجالات الأخرى المرتبطة به من بينها تقانات قواعد المعطيات والإحصاء والتعلم الآلي.
من الصعب إعطاء تعريف دقيق لعملية اكتشاف المعرفة من قواعد المعطيات كونها عملية معقدة تحاكي عمليات الاكتشاف التي يقوم بها الجهاز العصبي لدى الإنسان، والتعريف الأكثر شيوعاً هو: «عملية مركبة تهدف إلى تحديد الأجزاء المفيدة والمفهومة والجديدة من المعطيات». غالباً ما يستخدم التعبيران «تحري المعطيات» و«اكتشاف المعرفة» مترادفين، ومن الشائع استخدام مصطلح «تحري المعطيات» في مجال الصناعة، أما مصطلح «اكتشاف المعرفة» فتعبير شائع في مجال الأبحاث العلمية. وعلى أساس المنحى العلمي فإن عملية «تحري المعطيات» ليست مرحلة واحدة من مراحل «اكتشاف المعرفة». وتتألف من تحليل المعطيات، وخوارزميات الاكتشاف التي تنتج في زمن مقبول عينات خاصة من المعطيات.

تحري المعطيات وأدوات الاستعلام
ثمة فروق واضحة بين تحري المعطيات وطرائق الاستعلام ولغات الاستعلام الشائعة التي توفرها معظم نظم إدارة قواعد المعطيات، مثل لغة SQL. ففي حين صُممت لغات الاستعلام بهدف تقديم وسائل تمكن مستخدمها من تحديد المعطيات التي يود استخراجها من قاعدة ما، واختبار الفرضيات التي وضعها بناءً على المعطيات أو القيم المُستخرجة، صممت أدوات تحري المعطيات لتضع الفرضيات وتختبرها وتستنتج منها معلومات جديدة. ولتوضيح هذه الفكرة يمكن الموازنة بين هذين المنحيين في المثال الآتي: تريد إحدى شركات تصنيع الحواسيب معرفة معدلات بيع منتجاتها والوسائل الكفيلة بتحسين مردودها. فتبدأ بدراسة كل منتج من منتجاتها لتحديد معدل البيع في بعض مناطق العالم وتوازن بين هذه المعدلات لمعرفة مدى قبول المنتج في تلك المناطق. ولتحقيق ذلك يمكن استخدام إحدى لغات الاستعلام مثل SQL، ثم تدرس العلاقة بين متوسط دخل ا لفرد في كل دولة وعدد المنتجات التي تشتريها تلك الدولة سنوياً وهكذا، وفي كل مرة هناك فرضية يجري إثباتها أو نفيها. أما تقانات تحري المعطيات فإنها تعنى بالإجابة على السؤال الأعم من هذه الأسئلة الفرعية مثل «هل لاقى منتج ما نجاحاً كافياً، وماهي العوائق التي تحول دون الحصول على النجاح المطلوب، وما هي طرق تذليل تلك العقبات؟». لاتتطلب أداة التحري في هذه الحالة أي فرضيات، إنما تقوم بعملية الفرز والتصنيف والتحليل لاكتشاف العلاقات والمعلومات المخفية التي لا يمكن ملاحظتها دوماً.
وعموماً يمكن القول إنه في حال معرفة المطلوب تماماً، يمكن استخدام لغات الاستفسار مثل SQL، أما إذا كان ما يريده المستخدم غير واضح، ولديه فرضيات أو معايير، فلا بد من اللجوء إلى تقانات تحري المعطيات التي صار لها أهمية كبيرة لغموض المطلوب في أكثر الحالات.

التقانات المستخدمة في تحري المعطيات
ثمة طيف واسع من التقانات المستخدمة في تحري المعطيات يتميز كل منها بخصائص فريدة لاتوفرها التقانات الأخرى، ولذلك فإن اختيار تقانة التعرف الملائمة لحالة معينة ليس بالأمر السهل. ويمكن حصر أهم هذه التقانات بما يلي:
ـ أدوات الاستعلام query tools ومنها لغة SQL وغيرها. وهي الخطوة الأولى في عملية تحري المعطيات التي تستخدم أدوات استعلام تقليدية لمعرفة بنية المعطيات الأساسية بتطبيق خوارزميات تحليل معقدة.
ـ التقنيات الإحصائية statistical techniques.
ـ الإظهار visualization وهي طريقة مفيدة في استخلاص عينات من مجموعة المعطيات، تطبق في بداية عملية تحري المعطيات، لأنها تعطي فكرة جيدة حول كفاية المعطيات والعينات التي يمكن استخلاصها منها.
ـ أشجار القرار decision trees وهي تقانة مفيدة في تصنيف المعطيات وفقاً لمجموعة من الخواص المتدرجة التي تشكل شجرة القرار.
ـ القواعد المترابطة association rules.
ـ الشبكات العصبونية neural networks التي تقوم على محاكاة الدماغ البشري وكيفية التعلم والتعلم الذاتي، ومن ثمّ تحول عملية تحري المعطيات إلى قيم يمكن إرسالها إلى مداخل عقد الشبكة.
ـ الخوارزميات الجينية genetic algorithms التي اشتقت من علم البيولوجية والوراثة، وهي نوع متطور من استراتيجيات التعلم، تقوم على نظرية التطور، ويجري تحويل مشكلة تحري المعطيات إلى مجموعة من سلاسل صبغيات.
فإذا توصلت إحدى هذه التقنيات إلى إيجاد شكل مناسب، فبإمكان بقية التقنيات إيجاد هذا الشكل وتترجم المشكلة إلى تقنية التعلم learning technique ومن ثمّ يقوم مختصّ بإيجاد التمثيل الهندسي للشكل الناتج.

أمثلة عن أهمية تطبيق تقانات تحري المعطيات:
يمكن بيان أهمية تطبيق تقانات تحري المعطيات في مثال بسيط يعرض وضع شركة توزيع، تتلقى طلبات شراء من المواطنين، تُدخل هذه الطلبات في نظام معلوماتي قبل إرسال المواد والبضائع التي تتضمنها هذه الطلبات إلى الزبائن. بعد العمل مدة طويلة بهذه الطريقة، سوف يتوافر لدى هذه الشركة قاعدة معطيات مهمة تحتوي على المعلومات التي تتضمنها طلبات الزبائن في تلك المرحلة، وسوف تكون هذه القاعدة مصدراً مهماً للمعلومات، تستفيد منه الشركة في اتخاذ القرارات المناسبة لعملها، ووضع خططها المستقبلية وتحديد مجموعات الزبائن التي تتعامل معها، ومن ثمّ تصنيفها وفقاً للمناطق السكنية، أو الفئات العمرية، أو المنتجات المطلوبة، أوغيرها من المعايير البسيطة أو المركبة. كما تستطيع الشركة دراسة وسائل التسويق والدعاية التي تستخدمها، ومردود هذه الوسائل. فقد تكتشف الشركة أن عدد زبائنها الذين تعرفوا على منتجاتها من الرسائل البريدية التي أرسلتها إلى سكان منطقة سكنية معينة لم يتجاوز نسبة 4٪، وأن الربح الذي حققته من بيع منتجاتها لهذه الشريحة من الزبائن لا يغطي ما أنفقته في إرسال هذه الرسائل، ومن ثمّ لابد من إيجاد وسائل ترويج أكثر ملاءمة مثل الإعلان عن تخفيضات في أسعار بعض المنتجات أو توفير طرق تسديد تناسب مستوى دخلهم. كما يمكن تطبيق تقانات أكثر تعقيداً مثل الشبكات العصبونية لمحاكاة عملية إرسال الإعلانات بالبريد وتجاوب الزبائن مع هذه الرسائل. تتعلم الشركة من المعلومات المسجلة حول ما جرى في الماضي ما يرشدها بعد ذلك إلى اختيار العنوانات التي يمكن أن تتجاوب مع هذه الطريقة في الإعلان.
كذلك يمكن الانتقال إلى مستوى أكثر تعقيداً من دراسة الزبائن والعلاقة التي يمكن أن تكون بين مجموعات الزبائن ومجموعات المنتجات التي تسوقها الشركة؛ فالزبائن الذين يشترون اليوم ملابس لأطفالهم الرضع، قد يشترون بعد عشر سنوات الألعاب الإلكترونية لهؤلاء الأطفال.
يتبين من هذا المثال أهمية معرفة هذه الأنواع من القواعد وتطبيقها لإيجاد فرص تجارية أفضل، ومعرفة مدى فعالية طرق التسويق التي تطبقها وتدقيقها، ومقارنة هذه الوسائل وتحديد ما يناسب شريحة معينة من الزبائن.
لا يقتصر تحري المعطيات على التطبيقات من النوع السابق، وإنما يشمل طيفاً واسعاً من النشاطات، فمثل هذا التقانات تفيد، إذا ما طُبقت على قواعد المعطيات التي تحوي معطيات عن المشافي و المرضى الذين يدخلون، والأدوية التي يتعاطونها وطرق العلاج المستخدمة، ومدى استجابة الأمراض لها، والتوزع السكاني للمرضى، وأحوال الطقس في هذه المناطق السكنية، والأعمال التي يمارسها سكانها، ومستواهم التعليمي في معرفة الأمراض التي تصيب فئة معينة منهم، واكتشاف الأوبئة التي تصيب الناس في أوقات معينة واتخاذ الاحتياطات اللازمة لها، وغير ذلك من المعلومات؛ تفيد في اتخاذ قرارات تتعلق بتحسين مستوى الخدمات الطبية التي تقدمها هذه المشافي.
تكامل أنظمة دعم القرار مع عملية تحري المعطيات
تعد عملية تحري المعطيات أحد أشكال أنظمة دعم القرار، فهي تستخدم للاستعلام ولاستخلاص المعرفة من مخازن المعطيات المتوافرة. تتطلب عملية استكشاف المعرفة ست مراحل:
ـ اختيار المعطيات data selection ويجري في هذه المرحلة تجميع المعلومات المراد معالجتها من مخازن المعطيات المختلفة ووضعها في مخزن للمعطيات.
ـ التصفية cleaning وتتضمن إلغاء التسجيلات المتكررة، وتصحيح أخطاء كتابة سلاسل المحارف، وإضافة المعلومات الناقصة وغيرها.
ـ الإغناء enrichment.
ـ الترميز[ر] coding إذ يجري استخدام ترميز وتصنيف موحد للمعطيات ذات الدلالة المشتركة والمستوردة من بنوك المعطيات المعنية.
ـ تحري المعطيات.
ـ بناء التقارير reporting.
وتعد المرحلة الخامسة (مرحلة تحري المعطيات)مرحلة الاكتشاف الحقيقية.
ويستطيع المنقب عن المعطيات data miner الرجوع إلى الخلف خطوة واحدة أو أكثر، فقد يجد حين يكون في مرحلة الترميز أو مرحلة التحري، بأن مرحلة التصفية غير كاملة، أو قد يكتشف معطيات جديدة تغني مجموعات المعطيات الموجودة مسبقاً. ومن المستحيل وصف كامل تلوث المعطيات data pollution الذي يمكن توقع وجوده في قاعدة المعطيات سلفاً، إذ لا يمكن اكتشافه إلا في مرحلة التحري فقط.

التطبيقات العملية لتحري المعطيات والصعوبات الناتجة
تجاوزت تقانات تحري المعطيات طور الاختبار ودخلت حيز الاستخدام العملي في الدول المتقدمة. وقد كانت الشركات الكبيرة مثل شركات الهاتف والمصارف أول من طبق تقانات اكتشاف المعرفة في قواعد المعطيات لتحليل ملفات زبائنها. بعد ذلك اتسع مجال استخدام هذه التقانات ليشمل طيفاً واسعاً من النشاطات مثل شركات التأمين ومراكز دراسة أحوال الطقس والمؤسسات التعليمية والطبية وغيرها.
ومن الملاحظ أن 80٪ من أعمال اكتشاف المعرفة في قواعد المعطيات تقوم على تحضير المعطيات، أما 20٪ المتبقية فتقوم على التحري فيها.
وتعد مرحلة تحضير المعطيات التي تستخدم الإجراءات والأساليب التقليدية من قواعد المعطيات لإدخالها وترميزها، المرحلة الأكثر أهمية ضمن مراحل اكتشاف المعرفة. فمن دون معطيات صحيحة يبقى هناك نقص ما يجب البحث عنه.
ولما كان اكتشاف المعرفة وتحري المعطيات محورين جديدين من محاور المعلوماتية التي تتعامل مع معطيات الصناعة المتنامية بوتيرة عالية، مازال هذا العلم يواجه الكثير من المصاعب منها:
ـ عملية اكتشاف المعرفة: هناك حاجة إلى فهم أفضل لعملية اكتشاف المعرفة، إذ يجب تحديد المراحل المختلفة في هذه العملية، والعلاقات بين مختلف الخطوات في أثنائها، كذلك ينبغي وضع دليل يساعد محللي الأعمال ومهندسي تحري المعطيات في إنجاز مشاريع اكتشاف المعرفة.
ـ التغيرات والتبدلات في المعطيات: إن تبدل المعطيات باستمرار، وحفظها في قواعد المعطيات يجعل من عملية اكتشاف المعرفة الشغل الشاغل لأولئك الذين يسعون إلى إيجاد تقانات جديدة للتعامل مع تلك الأشكال المتغيرة، مما يضطرهم إلى إيجاد وسائل إضافية للتأكد من أن عملية اكتشاف المعرفة المستخدمة مازالت فعّالة لدى الانتقال إلى صيغ جديدة للمعطيات، وفي بعض الأحيان تعديل نموذج التحري المستخدم ليتناسب معها.
ـ المحاور المتعددة الاستراتيجيات: أحياناً يكون استخدام نوع واحد من خوارزميات تحري المعطيات غير كافٍ للإجابة عن سؤال معقد نوعاً ما. ولذلك تظهر الحاجة إلى توظيف عدة استراتيجيات قائمة على استخدام مجموعة من التقانات للإجابة عن سؤال واحد.
ـ تدرج عملية اكتشاف المعرفة وتحري المعطيات:
يزداد كمّ المعطيات بسرعة، وتتطلب قواعد المعطيات اليوم استخدام طرائق فعّالة للوصول إلى المعطيات. وهي أيضاً مجبرة على استخدام خوارزميات تحري المعطيات، التي يجب تعديلها بما يتناسب مع هذا الكمّ المتزايد من المعطيات. كذلك ينبغي توظيف تقانات لتخليص المعطيات قبل القيام بعملية التحري فيها ضمن عملية اكتشاف المعرفة.



 

رد مع اقتباس
قديم 2014-01-05, 07:12 PM   #2 (المشاركة)
سحاب الطائف
«۩۞۩ عضو فعال ۩۞۩»


الصورة الرمزية سحاب الطائف
سحاب الطائف غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 4091
 تاريخ التسجيل :  Oct 2013
 أخر زيارة : 2018-02-27 (11:56 AM)
 المشاركات : 245 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000ie
افتراضي




شكرا لكم وتقبلوا مروري



 

رد مع اقتباس
قديم 2014-01-06, 06:43 PM   #3 (المشاركة)
عبدالله اللحياني
«۩۞۩ عضو فعال ۩۞۩»


الصورة الرمزية عبدالله اللحياني
عبدالله اللحياني غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 1550
 تاريخ التسجيل :  Jun 2012
 أخر زيارة : 2014-03-12 (11:17 AM)
 المشاركات : 291 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000ie
افتراضي




شكرا لك على الموضوع الجميل والمفيذ ♥
وجزاك الله كل خير على كل ما تقدمه للمنتدى ♥



 

رد مع اقتباس
قديم 2014-01-07, 10:00 PM   #4 (المشاركة)
اميرة الانصاري
«۩۞۩ عضو فعال ۩۞۩»


الصورة الرمزية اميرة الانصاري
اميرة الانصاري غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 3668
 تاريخ التسجيل :  Jun 2013
 أخر زيارة : 2014-04-22 (08:11 PM)
 المشاركات : 255 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000safari
افتراضي




جزاكم الله الفردوس إن شاء الله
ودمتم بحفظ الله ورعايته



 

رد مع اقتباس
قديم 2015-04-28, 08:20 PM   #5 (المشاركة)
اسامه الاركاني
«۩۞۩ عضو فعال ۩۞۩»


الصورة الرمزية اسامه الاركاني
اسامه الاركاني غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 3466
 تاريخ التسجيل :  May 2013
 أخر زيارة : 2015-05-02 (09:23 AM)
 المشاركات : 272 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000ie
افتراضي




أإسـ عٍ ـد الله أوٍقـآتَكُـم بكُـل خَ ـيرٍ وشكراً للموضوع القيم



 

رد مع اقتباس
قديم 2018-09-15, 09:26 AM   #6 (المشاركة)
سلوى الصاعدي
«۩۞۩ عضوية فضية ۩۞۩»


الصورة الرمزية سلوى الصاعدي
سلوى الصاعدي غير متواجد حالياً

بيانات اضافيه [ + ]
 رقم العضوية : 2357
 تاريخ التسجيل :  Dec 2012
 أخر زيارة : 2019-09-06 (12:16 PM)
 المشاركات : 1,003 [ + ]
 التقييم :  50
لوني المفضل : Cadetblue
windows_98_nt_2000ie
افتراضي




جزيت بالجنة وبارك الله فيكمـ



 

رد مع اقتباس
 
إضافة رد
أدوات الموضوع

تعليمات المشاركة
لا تستطيع إضافة مواضيع جديدة
لا تستطيع الرد على المواضيع
لا تستطيع إرفاق ملفات
لا تستطيع تعديل مشاركاتك

BB code is متاحة
كود [IMG] متاحة
كود HTML معطلة
Trackbacks are معطلة
Pingbacks are معطلة
Refbacks are معطلة


المواضيع المتشابهه
الموضوع كاتب الموضوع المنتدى مشاركات آخر مشاركة
البيانات data ‏رفيـع الشـان العلوم الإنسانية والتربية والفنون 5 2019-01-28 01:02 PM
بلاك بيري 2011 , خلفيات جديده للبلاك بيري 2011 بنت الوادي ركن الجوالات - الاتصالات 5 2018-06-08 10:48 PM
تراسل المعطيات data communication رواد العلم العلوم التطبيقية - العلوم البحتة 5 2018-05-26 09:22 PM
بنية المعطيات Data Structure رواد العلم العلوم التطبيقية - العلوم البحتة 5 2016-03-23 06:56 PM
بنك المعطيات data bank رواد العلم العلوم التطبيقية - العلوم البحتة 5 2016-03-23 06:55 PM





1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287