سلام
آنچه حقیر متوجه شدم Data mining برخاسته از هوش مصنوعیست و برای تجزیه و تحلیل حجم زیاد داده ها که روشهای آماری قادر به جوابگویی آن نیستند، مورد استفاده قرار می گیرد.
مطابق سخنرانی پرفسور نخعی زاده در تاریخ 5/9/86 در این مورد
در حقیقت لازمه ی Data mining سرمایه گذاری برای جمع آوری داده ها و دسترسی آسان به داده هاست.
شما می توانید با یک جستجو در اینترنت با عنوان:
The largest Databases in the world
به جدولی شامل 10 Database قوی در جهان دست یابید. بطور مثال: یک مورد آن مرکز هواشناسی آلمان و مورد دیگر آن مرکز داده های جهانی است. سومین مورد مربوط به علم فیزیک می باشد که دانشمندان با تعداد کثیری از داده ها، سعی در کشف نحوه ی ایجاد جهان هستی داشته و در مورد مسائلی نظیر ماده و پارا ماده در حال کاوش هستند. مورد چهارم YouTube است که گنجینه ی ویدیویی است در رابطه با انواع موضوعات.
Data mining یک قسمت از (Knowing Discovery in Database (KDD است اما امروزه این دو به صورت موازی استفاده می شوند.
در حقیقت مقصود از Data mining یافتن الگویی در اعداد و داده هاست تا با استفاده از آن قادر باشیم رفتار بقیه داده ها را نیز پیش بینی کنیم.
این پیش بینی نمودن تفاوت علم آمار و دیتا ماینینگ است
این الگو می بایست 4 ویژگی داشته باشد:
1)قابل دسترس باشد
2)مفید باشد
3)جدید باشد
4)قابل درک باشد
مثال) در یک سوپرمارکت الگویی از روی داده ها ارائه می شود که می گوید کدام دو محصول در اغلب اوقات با هم خریداری می شوند.
Data Mining فرآیندی است که به ابزارهای زیر نیاز دارد:
ریشه های دیتاماینینگ
- Database Technology تکنولوژی دیتابیس
- Statistics
- Artificial Intelligence (دانشمندان این رشته با روشهای متفاوت به تنایج یکسانی با دانشمندان آمار رسیده اند.)
- Visualization (که همان تصویر سازی است. این بخش برای مدیران بسیار جالب است که مثلا گزارش کل عملکردهای قسمتهای مختلف کارخانه را بصورت نمودار بر روی دیوار اتاق خود نصب کنند.)
- Privacy (تضاد منابع. مثلا اشخاص مایل نیستند که درآمد حقیقی خود را بگویند، در این صورت Data Miner ها، اعداد را گمنام می کنند تا کسی متوجه درآمد شخص مورد نظر نشود و در عین حال بتواند از داده های درست استفاده کند.
دو مورد دیگر Mining یا همان کاوش و تجزیه و تحلیل Text ها و Web هاست که امروزه با انفجار اطلاعات، بسیار مورد استفاده قرار می گیرد. بطور مثال سایت آمازون تمامی اطلاعات کاربرانی که به این سایت مراجعه می کنند را ثبت می کند و از این داده ها در جهت بهبود عملکرد خود بهره می گیرد که با خیل عظیم داده ها، این کار جز با web mining امکان پذیر نمی باشد.
امروزه ترکیب Data mining، Text miningو Web mining با نام Information mining شناخته می شود.
پیروز باشید