
1- داده کاوی یا data mining چیست؟
فرايندی است که با استفاده از تکنيکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج می کند.
داده کاوي عبارت است از فرايند استخراج اطلاعات معتبر ، از پيش ناشناخته ، قابل فهم و قابل اعتماد از پايگاه داده هاي بزرگ و استفاده از آن در تصميم گيري در فعاليت هاي تجاري مهم.
2- دو مشکل اصلی که اکثر سیستم های داده کاوی با آن مواجه هستند را نام ببرید ؟
حجم بالای داده های آموزشی
وجود عدم قطعيت در اطلاعات
3- عدم قطعیت در سیستم های پایگاه داده رو به طور کلی بنویسید ؟
اطلاعات ناکامل (مقادير نامشخص): منظور خصيصه هايی است که مقداری برای آنها ثبت نشده است.
اطلاعات ناسازگار: اطلاعاتی که در اثر اندازه گيری نادرست يا بوجود آمدن نويز در داده ها ايجاد شده باشد و مقادير ثبت شده با مقادير واقعی برابر نباشند.