مشخصات فایل
عنوان: تعاریف و تنظیم داده های آماری
قالب بندی: word
تعداد صفحات: 39
محتویات
تعاریف و تنظیم داده های آماری
تعریف علم آمار
واریانس
خواص واریانس
انحراف معیار
ضریب همبستگی
استاندارد کردن ضریب همبستگی
فراوانی مطلق و نسبی
تعریف احتمال برمبنای فراوانی نسبی
تعریف کلاسیک احتمال
قضایای مربوط به احتمال
احتمال هندسی
تعریف محتمل ترین حادثه
کابرد آزمون در همبستگی نسبتها
کاربرد برای آزمون نرمال بودن توزیع
امید ریاضی کمیت تصادفی نا پیوسته
امید ریاضی کمیت تصادفی پیوسته
خواص امید ریاضی
عنوان مقاله: تعاریف و تنظیم داده های آماری
قبل از آنکه علم آمار تعریف گردد لازم است کمی راجع به تاریخچه آن سخن به میان بیاید تاریخچه علم آماررا می توان از بدو تشکیل دولتها آغاز کرد ، زیرا کلمه آمار Statusticesاز کلمه State به معنی دولت گرفته شده است . دولتهای اولیه نیز برای پی بردن به سلطه و قلمروخود احتیاج به آن داشتند . البته در آن زمان منظور از آمار ارقام و اطلاعات مورد نیاز دولتها برای گرفتن مالیات و سربازی و سایر امور مربوطه به کشورداری و سیاست بوده است .
از چند هزار سال قبل از مسیح در کشورهای مصر و چین و هندوستان قدیم سرشماری نفوس و همچنین اندازه میزان – دارائی تحت نفوذ دولتها انجام گردیده است و یا اینکه اغلب به طور ناقص انجام گردیده است ، با این حال همین شمارشهای ابتدائی پایه و اساس آمار امروزی را بنیان نهاده است ولی تقریباً در نیم قرن اخیر همراه با سایر علوم ، علم آمار نیز سیر صعودی را پیموده و گاهی پیشتاز و پیش قراول بعضی از علوم بوده است ، که با استفاده از آن بود که اغلب علوم چند برابر سرعت سیر عادی خود را گرفتند ، زیرا روشها و فنونی که برای تحقیقات علمی ضروری هستند از علم آمار بدست میآید ، بخصوص در علوم فیزیکی و زیست شناسی و اجتماعی و اقتصادی بکار برده می شود . ناگفته نماند گاه ممکن است که یک روش معین تنها به منظور استفاده در یک رشته خاص پژوهش علمی طرح ریزی شده باشد . این بدان معنی نیست که در آن رشته بخصوص آمار کاربرد زیادی دارد .
از آنجائیکه علم آمار ریشه و علایقش به کلیه علوم بشری رسیده است ، امروزه در تمامی دانشگاههای جهان در اکثر رشته های مختلف دانشگاهی اعم از رشته های پزشکی ، فنی ، کشاورزی و برنامه ریزی و… تدریس می شود . برای آنکه هدف این درس بهتر معلوم شود ، لازم است بدواً علم آمار را تعریف نمائیم .
حال چند تعریف را از بین کلیه تعاریف که جامع تر به نظر می آید بیان می کنیم . لازم به تذکر است که برای علم آمار تعاریف زیادی شده است .
۴-۳- واریانس ۱
در میانگین قدر مطلق انحرافات برای اینکه انحرافات مثبت و منفی یکدیگر را خنثی نکنند آن را به صورت قدر مطلق بیان کردیم . این منظور از راه مجذور کردن انحرافات نیز ممکن بود تا فرمول از حالت جبری خارج نشود . بدین طریق مشخص کننده جدیدی از پراکندگی که از هر حیث بر مشخص کننده های قبلی برتری دارد بدست خواهد آمد که آن را واریانس می نامند و یا ، نمایش می دهند . ( واریانس واقعی جامعه را با نشان می دهند )
و عادتاً در این کتاب آن را با نشان خواهیم داد .
در صورتیکه داده های آماری به صورت جدول توزیع فراوانی باشد به بیان دیگر فراوانیهای مقادیر صفت یکسان نباشد ( مانند میانگین حسابی سا ده و میانگین وزنی ) فرمول واریانس به صورت زیر خواهد بود .
معمولا صورت واریانس یعنی مجموع مجذور و انحرافات از میانگین را با (۲) و به طور خلاصه با SS نمایش می دهند در نتیجه فرمول واریانس در حالت کلی به زیر خواهد بود .
چو ن محاسبه واریانس به این صورت خالی از اشکال نیست (چرا ؟) بدین جهت صورت کسر واریانس (SS) را بسط داده به صورت زیر در می آیند .
(اثبات این فرمول بعهده دانشجویان گذارده می شود )
در نتیجه فرمول کلی واریانس عبارت خواهد بو د:
وگاهی را با علامت اختصاری یعنی عامل تصحیح (Correction Factor)
نشان می دهند .
و با استفاده از نتیج می شود که
در نتیجه فرمول عبارت خواهد بود از :
و فرمول واریانس نیز به صورت زیر در می آید .
ویا
در صورتی که داده های آماری به صورت فراوانی نسبی بیان شود فرمول واریانس برابر خواهد بود
مانند تمام مشخص کننده های پیش بهتر است محاسبه آن به کمک جدول انجام گیرد . یادآور می شود که در مقایسه دو یا چند جامعه ، جامعه ایکه واریانس آن کمتر است مقادیر صفت متغیر مورد مطالعه آن جامعه یکنواخت تر از جامعه های دیگر می باشد .
تبصره ((در مواردی که تعداد نمونه نسبت به تعداد کل جامعه خیلی کوچک باشد واریانس را از فرمول بدست می آورند ))
۴-۳-۱- خواص واریانس
چون فرمول واریانس به صورت جبری بیان گردیده است لذا با توجه به فرمول آن می توان خواص زیر را بیان کرد و این خواص به ما کمک می کند که محاسبات را آسان تر بدست آوریم .
که در آن میانگین کل می باشد .
مشخصات فایل
عنوان: داده کاوی، مفاهیم و کاربرد
قالب بندی: word
تعداد صفحات:101
محتویات
فهرست
فصل اول – مفاهیم داده کاوی.. 9
مدیریت ذخیره سازی و دستیابی اطلاعات... 9
ساختار بانک اطلاعاتی سازمان: 10
مراحل فرایند کشف دانش از پایگاه داده ها 16
آماده سازی داده برای مدل سازی.. 30
ابزارهای تجاری داده کاوی Tools DM Commercial 46
منابع اطلاعاتی مورد استفاده 47
حفاظت از حریم شخصی در سیستمهای دادهکاوی.. 56
فصل دوم : کاربردهای داده کاوی.. 59
کاربرد داده کاوی در کسب و کار هوشمند بانک..... 60
داده کاوی درمدیریت ارتباط بامشتری.. 61
کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی.. 63
داده کاوی و مدیریت موسسات دانشگاهی.. 65
داده کاوی و مدیریت بهینه وب سایت ها 66
دادهکاوی و مدیریت دانش.... 67
کاربرد دادهکاوی در آموزش عالی.. 68
فصل سوم – بررسی موردی1: وب کاوی.. 70
مشکلات ومحدودیت های وب کاوی در سایت های فارسی زبان. 75
فصل چهارم – بررسی موردی 2 : داده کاوی در شهر الکترونیک... 79
زمینه دادهکاوی در شهر الکترونیک... 81
کاربردهای دادهکاوی در شهر الکترونیک..... 83
چالشهای دادهکاوی در شهر الکترونیک..... 88
چکیده
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها ، نیاز به ابزاری است تا بتوان داده های ذخیره شده را پردازش کردواطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد .
با استفاده از پرسش های ساده در SQL و ابزارهای گوناگون گزارش گیری معمولی ، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد ، کاربران هر چند زبر دست و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند ، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است .
از سوی دیگر کاربران معمولا فرضیه ای را مطرح می کنند و سپس بر اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می پردازند ، در حالی که امروزه نیاز به روشهایی است که اصطلاحا به کشف دانش بپردازند یعنی با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند .
داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند .
در داده کاوی از بخشی از علم آمار به نام تحلیل اکتشافی داده ها استفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده ها تاکید می شود . علاوه بر این داده کاوی با هوش مصنوعی و یادگیری ماشین نیز ارتباط تنگاتنگی دارد ، بنابراین می توان گفت در داده کاوی تئوریهای پایگاه داده ها ، هوش مصنوعی ، یادگیری ماشین و علم آمار را در هم می آمیزند تا زمینه کاربردی فراهم شود .
باید توجه داشت که اصطلاح داده کاوی زمانی به کار برده می شود که با حجم بزرگی از داده ها ، در حد مگا یا ترابایت ، مواجه باشیم . در تمامی منابع داده کاوی بر این مطلب تاکید شده است .
هر چه حجم داده ها بیشتر و روابط میان آنها پیچیده تر باشد دسترسی به اطلاعات نهفته در میان داده ها مشکلتر می شود و نقش داده کاوی به عنوان یکی از روشهای کشف دانش ، روشن تر می گردد .
مقدمه
با گسترش فناوری اطلاعات و ارتباطات[1] درجهان و ورود سریع آن به زندگی روزمره مردم مسائل و ضرورتهای تازهای بهوجودآمدهاست .امروزه انسان توسعه یافته کسی است که به اطلاعات دسترسی داشتهباشد و دسترسی به اطلاعات نه یک ضرورت،که یک قدرت محسوبمیشود. دراینمیان شهرها به عنوان مراکز قدرت انسانی و تمدنهای بشری بیش از پیش اهمیتیافتهاند. به اعتقاد الوین تافلر، مردم کره زمین تا به امروز سه موج اساسی تحول راپشت سرگذاشته اند :
موج اول، موج انقلاب کشاوزی است که زمان آغاز آن برکسی مشخص نیست.
موج دوم، انقلاب صنعتی است که به دنبال اختراع ماشین بخار در سال 1764آغاز شد.
موج سوم یا انقلاب انفورماتیک است که ازسال 1946 که بشر به ساخت کامپیوتر نائل آمده آغاز گشتهاست.
اگر در موج دوم سختافزارها به کمک انسانها میآمدند، درموج سوم این نرمافزارها هستند که به خدمت بشر میشتابند و تفکرات و تصورات آدمی را به شکل کدهای صفر و یک و با کمک امواج ماهوارهای مبادله میکنند.
در موج سوم، انسان هر روز که بیشتر یاد میگیرد، بیشترمی فهمدکه با حقیقت فاصله دارد .موج سوم راموج خردورزی نیز لقب داده اند زیرا در این عرصهها، انسانها دیگر فرصت ندارند زیاد با هم صحبتکنند، همه چیز تعریفشده و برای هر تعریف، یک کد درنظرگرفتهشدهاست.
از سوی دیگر در دنیای به شدت رقابتی امروز، اطلاعات بعنوان یکی از فاکتورهای تولیدی مهم پدیدار شده است. در نتیجه تلاش برای استخراج اطلاعات از داده ها توجه بسیاری از افراد دخیل در صنعت اطلاعات و حوزه های وابسته را به خود جلب نموده است.
حجم بالای داده های دائما در حال رشد در همه حوزه ها و نیز تنوع آنها به شکل داده متنی، اعداد، گرافیکها، نقشه ها، عکسها، تصاویر ماهواره ای و عکسهای گرفته شده با اشعه ایکس نمایانگر پیچیدگی کار تبدیل داده ها به اطلاعات است. علاوه بر این، تفاوت وسیع در فرآیندهای تولید داده مثل روش آنالوگ مبتنی بر کاغذ و روش دیجیتالی مبتنی بر کامپیوتر، مزید بر علت شده است. استراتژیها و فنون متعددی برای گردآوری، ذخیره، سازماندهی و مدیریت کارآمد داده های موجود و رسیدن به نتایج معنی دار بکار گرفته شده اند. بعلاوه، عملکرد مناسب ابرداده که داده ای درباره داده است در عمل عالی بنظر میرسد.
پیشرفتهای حاصله در علم اطلاع رسانی و تکنولوژی اطلاعات، فنون و ابزارهای جدیدی برای غلبه بر رشد مستمر و تنوع بانکهای اطلاعاتی تامین می کنند. این پیشرفتها هم در بعد سخت افزاری و هم نرم افزاری حاصل شده اند.
ریزپردازنده های سریع، ابزارهای ذخیره داده های انبوه پیوسته و غیر پیوسته، اسکنرها، چاپگرها و دیگر ابزارهای جانبی نمایانگر پیشرفتهای حوزه سخت افزار هستند. پیشرفتهای حاصل در نظامهای مدیریت بانک اطلاعات در طی چهار دهه گذشته نمایانگر تلاشهای بخش نرم افزاری است.
این تلاشها در بخش نرم افزار را میتوان بعنوان یک حرکت پیشرونده از ایجاد یک بانک اطلاعات ساده تا شبکه ها و بانکهای اطلاعاتی رابطه ای و سلسله مراتبی برای پاسخگویی به نیاز روزافزون سازماندهی و بازیابی اطلاعات ملاحظه نمود. بدین منظور در هر دوره، نظامهای مدیریت بانک اطلاعاتی مناسب سازگار با نرم افزار سیستم عامل و سخت افزار رایج گسترش یافته اند. در این رابطه میتوان از محصولاتی مانند، Dbase-IV, Unify, Sybase, Oracle و غیره نام برد.
داده کاوی یکی از پیشرفتهای اخیر در راستای فن آوریهای مدیریت داده هاست. داده کاوی مجموعه ای از فنون است که به شخص امکان میدهد تا ورای داده پردازی معمولی حرکت کند و به استخراج اطلاعاتی که در انبوه داده ها مخفی و یا پنهان است کمک می کند. انگیزه برای گسترش داده کاوی بطور عمده از دنیای تجارت در دهه 1990 پدید آمد. مثلا داده کاوی در حوزه بازاریابی، بدلیل پیوستگی غیرقابل انتظاری که بین پروفایل یک مشتری و الگوی خرید او ایجاد میکند اهمیتی خاص دارد.
تحلیل رکوردهای حجیم نگهداری سخت افزارهای صنعتی، داده های هواشناسی و دیدن کانال های تلوزیونی از دیگر کاربردهای آن است. در حوزه مدیریت کتابخانه کاربرد داده کاوی بعنوان فرایند ماخذ کاوی نامگذاری شده است. این مقاله به کاربردهای داده کاوی در مدیریت کتابخانه ها و موسسات آموزشی می پردازد. در ابتدا به چند سیستم سازماندهی داده ها که ارتباط نزدیکی به داده کاوی دارند می پردازد؛ سپس عناصر داده ای توصیف میشوند و درپایان چگونگی بکارگیری داده کاوی در کتابخانه ها و موسسات آموزشی مورد بحث قرار گرفته و مسائل عملی مرتبط در نظر گرفته می شوند.
فصل اول – مفاهیم داده کاوی مدیریت ذخیره سازی و دستیابی اطلاعات
داده های اطلاعاتی به عنوان یکی از منابع حیاتی سازمان شناخته می شود و بسیاری از سازمان ها با اطلاعات و دانش سازمانی خود مانند سایر دارایی های ارزشمندشان برخورد می کنند .
نکته: داده اطلاعاتی (Data) به اطلاعات خام سازمان اتلاق میشود و اطلاعات (Information) به دادههای پردازش شده. همچنین داده های پردازش شده پس از طبقه بندی و آنالیز به دانش سازمان (Knowledge) تبدیل می گردند.
[1] Information and Communication Technology(ICT)
مشخصات فایل
عنوان: پاورپوینت مدل مدیریتی کنترل دسترسی نقش مبنا و امنیت پایگاه داده
قالب بندی : پاورپوینت
تعداد اسلاید:53
محتویات
فهرست مطالب
مشخصات فایل
عنوان: دانلود پاورپوینت پیرامون انبار داده Data Warehouse
قالب بندی: پاورپوینت
تعداد اسلاید: 30
محتویات
انبار داده بـه مجـموعـه ای از داده هــا گفـتـه می شود که از منابع مختلف اطلاعاتی سازمان جمع آوری ، دسته بندی و ذخیره می شود. در واقع یک انبار داده مخزن اصلی کلیه داده های حال و گذشته یک سازمان می باشد که برای همیشه جهت انجام عملیات گزارش گیری و آنالیز در دسترس مدیران می باشد.
انبار داده (Data Warehouse) چیست؟
تاریخچه و دلایل استفاده از انبار داده
مراحل و نحوه ایجاد انبار داده در سازمان
ویژگیهای اصلی دادههای انبار دادهها
سیستمهای انبار دادهها
طراحی انباردادهها
انبار دادههای مجازی
مولفه انبارها در سازمان
طراحی پایگاه داده ها
فواید داشتن معماری انبار کالا داده ها
نتیجه گیری
مشخصات فایل
عنوان: دانلود تحقیق و مقاله پیرامون داده کاوی در بانک اطلاعاتی
قالب بندی: word
تعداد صفحات:10
محتویات
معرفی دادهکاوی و دلایل پیدایش آن
تعاریف داده کاوی
جایگاه دادهکاوی در علوم کامپیوتر
1-1 مقیاس دهی اعشاری
2-1 نرمال سازی حداقل-حداکثر
3-1 نرمال سازی انحراف معیار
2-1 کاهش زمان محاسبه.
2-2 افزایش یادگیری در دقت پیشگویانه/توصیفی.
2-3 سادگی در ارائه مدل داده کاوی.
مقدمه
امروزه با گسترش سیستم های پایگاهی و حجم بالای داده ها ی ذخیره شده در این سیستم ها، نیاز به ابزاری است تا بتوان داده های ذخیره شده پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.
با استفاده ار پرسش های ساده درSQL و ابزارهای گوناگون گزارش گیری معمولی، می توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه گیری در مورد داده ها و روابط منطقی میان آنها بپردازند اما وقتی که حجم داده ها بالا باشد، کاربران هر چقدرحرفه ای و با تجربه باشند نمی توانند الگوهای مفید را در میان حجم انبوه داده ها تشخیص دهند و یا اگر قادر به این کار هم با شند، هزینه عملیات از نظر نیروی انسانی و مالی بسیار بالا است.
بنابراین میشود گفت که درحال حاضر یک تغییر الگو از مدل سازی و تحلیل های کلاسیک برپایه اصول اولیه به مدل های درحال پیشرفت و تحلیل های مربوط بطور مستقیم از داده ها وجود دارد.
داده کاوی یکی از مهمترین این روشها است که به وسیله آن الگوهای مفید در داده ها با حداقل دخالت کاربران شناخته می شوند و اطلاعاتی را در اختیار کاربران و تحلیل گران قرار می دهند تا براساس آنها تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.
تعاریف داده کاوی
در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده اند. در برخی از این تعاریف داده کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده ها می سازد معرفی گردیده است و در برخی دیگر، تعاریف دقیقتر که درآنها به کاوش در داده ها توجه می شود موجود است.
برخی از این تعاریف عبارتند از :
نکته: همانگونه که در تعاریف گوناگون داده کاوی مشاهده می شود، تقریبا در تمامی تعاریف به مفاهیمی چون استخراج دانش ، تحلیل و یافتن الگوی بین داده ها اشاره شده است.
" داده کاوی فرآیندی است که طی آن با استفاده از ابزار های تحلیل داده به دنبال کشف الگوها و ارتباطات میان داده های موجود که ممکن است منجر به استخراج اطلاعات جدیدی از پایگاه داده گردند، می باشد."
در داده کاوی از بخشی از به نام تحلیل اکتشافی داده ها استفاده می شود که در آن بر کشف اطلاعات نهفته و ناشناخته از درون حجم انبوه داده ها تاکید می شودبنابراین می توان گفت در داده کاوی تئوریهای پایگاه داده ها، هوش مصنوعی، یادگیری ماشین وعلم آمار را در هم می آمیزند تا زمینه کاربردی فراهم شود.
باید توجه داشت که اصطلاح داده کاوی زمانی به کار برده می شود که با حجم بزرگی از داده ها در حد گیگابایت یا ترابایت، مواجه باشیم که از این نظر یکی از بزرگترین بازارهای هدف، انبارجامع داده ها، مراکز داده وسیستم های پشتیبانی تصمیم برای بدست آوردن تخصص هایی در صنایعی مثل شبکه های توزیع مویرگی، تولیدف مخابرات، بیمه و... می باشد.
نکته: در تعاریفی که از داده کاوی ارائه شد به اصطلاح "فرایند" اشاره شد. حتی در بعضی محیط های حرفه ای این نظر وجود دادرد که داده کاوی شامل انتخاب و بکارگیری ابزارهای مبتنی بر کامپیوتر برای حل مسائل فعلی و بدست آوردن یک راه حل بطور اتوماتیک و خودکار میباشد.
برای اموزش داده کاوی، باید بر مفاهیم و روش های اعمال شده برخلاف همه جاذبه های ابزارهای مبتنی بر کامپیوتر که امور رابا جزئیات ودستورات با فرمت های خاصی باید به خیلی از سوالات از جمله چگونگی طراحی واستفاده از فرایندها را پاسخ داد به جای بیان جزئیات عملی ابزار مختلف داده کاوی تکیه نمود.
طبقه بندی روش های داده کاوی:
در این روش توصیف، هدف کلی بدست اوردن یک شناخت از سیستم های تجزیه و تحلیل شده توسط الگوها و روابط بین داده هایData Warehouse ها که تحت عناوینی مثل کشف الگوی ترتیبی، کشف قانون وابستگی و خوشه بندی هستند، می باشد.
مراحل فرایند کشف دانش از پایگاه داده ها
فرایند کشف دانش از پایگاه داده ها شامل پنج مرحله است که عبارتند از:
بیان مسئله و فرموله کردن فرضیه:
در ابتدای امر پیش زمینه کشف دانش، فهم درست داده و مساله می باشد. بدون این فهم درست هیچ الگوریتمی صرف نظر از خبره بودن آن نمی تواند نتیجه مطمئنی برای شما حاصل نماید و داده را جهت کاوش آماده نموده یا نتایج را به طور صحیح تفسیر نمود. برای استفاده بهتر از داده کاوی باید یک بیان واضح از هدف داشت. در این مرحله انچه نیاز است ترکیبی از تخصص یک زمینه کاربردی و یک مدل داده کاوی است و شاید بتوان گفت یک تقابل نزدیک سر یک مسئله واحد و چندین فرضیه فرموله شده بین متخصصین داده کاوی و متخصصین کاربردی میباشد.
این مرحله درارتباط با چگونگی تولید و جمع آوری داده ها است.
بطور کلی، دو امکان وجود دارد:
روش آزمون طراحی: زمانی است که فرایند تولید داده ها تحت کنترل یک متخصص کاربردی)مدل ساز سیستم( باشد.
روش دیداری: امکان دوم زمانی مطرح است که متخصص قادر به تولید فرآیند نیست یعنی تولید داده بصورت تصادفی در نظر گرفته شود.
پس از اینکه داده ها جمع اوری شدند یا در فرایند جمع اوری داده ها تا اندازه ای قرار گرفتند، توزیع نمونه گیری کاملا نامعلوم است.(یعنی داده هایی که بعدا برای تست و بکارگیری آن مدل بکار می روند از چند نمونه مشابه استفاده می شوند.)
نکته: برای فرایند داده کاوی داده ها ی مورد نیاز موجود در انبار داده ها باید انتخاب شوند. درک این مطلب که برای ارزیابی یک مدل که بعدا برای تست و بکارگیری آن مدل بکار می رود، موفقیت آمیز باشد، بسیار مهم است در غیر اینصورت نتایج درستی حاصل نمی گردد.
مثلا انبار داده ها شامل انواع مختلف و گوناگونی از داده ها است به عنوان مثال در یک پایگاه داده های مربوط به سیستم فروشگاهی، اطلاعاتی در مورد خرید مشتریان، خصوصیات آماری آنها،dispatcher ها (توزیع کنندگان)، مشتریان، حسابداری و ... وجود دارند که همه آنها در داده کاوی مورد نیاز نیستند.
زمانی که که داده های مورد نیاز از پایگاه داده های موجود در انبار داده ها "جمع اوری" شدند و داده های مورد کاوش مشخص گردیدند، معمولا به تبدیلات خاصی روی داده ها نیاز است که شامل حداقل دو مرحله متداول می باشد:
داده های غیرعادی یا غیر معمول درحقیقت داده های نتیجه سنجش خطاها، کدنویسی و ثبت خطاها است. دراینجا باید یا 1. داده های غیرعادی را تشخیص داد و خذف کرد ویا 2. باید روش های قوی مدل سازی رابگونه ای توسعه داد که نسبت به این نوع داده ها غیر حساس باشند.
در تبدیل داده ها توصیه میشود که داده ها را جهت تحلیل و بررسی مقیاس بندی و ورمزگذاری کرد. مثلا یک مشخصه با دامنه [0,1] ودیگری با دامنه [-100,1000] دارای ارزش مشابهی در تکنیک های اعلام شده نیستند. که در صورت نادیده گرفتن همین تفاوت در دامنه داده ها، روی نتایج نهایی داده کاوی تاثیر خواهند گذاشت.
و . . .
مشخصات فایل
عنوان: داده های ساختمان زمین شناسی
قالب بندی: پاورپوینت
تعداد اسلاید: 89
محتویات
فصل اول: داده های ساختمان زمین شناسی
فصل دوم: سنگهای رسو بی و سنگهای د گرگونی
فصل سوم: حرکات زمین ساخت
فصل چهارم: مجمو عه های سا ختمانی بزرگ کره ی زمین
فصل پنجم: اشکال اولیه ی سا ختمانی
فصل ششم: ساختما نهای یک شیبی
و . . .
ژئومور فلوژی به معنا ی پیکر شناسی و یا ریخت شنا سی می باشد که هدف
ا ز این علم مطالعه ی اجزای اصلی تشکیل دهنده ی ناهمواریها ست .
دامنه عبا رتند از: سطوح کم وبیش وسیعی که نا همواریها را به یکدیگر پیوند می دهد . که ویژگی مهم این عارضه در درجه ی اول شیب آ ن است که قابل اندا زه گیری می باشد و بر حسب درصد یا درجه بیان می شود .
دامنه کوژودامنه ی کاوعبا رتند از :اگر میزان شیب از قله به سمت پایکوه افزایش یابد دامنه کوژ است واگر میزان شیب در همین جهت کاهش یابد دامنه کاو خواهد بود .
اشکال متنوع نا همواریها عبارتند از : دره ها یی به نام خط القعر که بسته به شکل وحجم آنها به وسیله ی میانا بهایی به نام طاق ،تیغه وتپه از هم جدا شده اند ناهمواریهای بزرگتری نیز وجود دارد که به نامهای کو هستان یا فلات یا دشت ومانند آنها نامگذاری شده اند .
پیکر شناسی ساختما نی عبا رتند از : مطالعه ی ناهمواریها در رابطه باساختمان زمین شنا سی و طبقه بندی اشکال ساختما نی
انواع سنگهای آ ذ رین یا درونی عبارتند از : 1- سنگهای آ تشفشانی . 2- سنگهای آذرین درونی یا نفوذی . 3- سنگهای ماگمایی .
مشخصات فایل
عنوان: پاورپوینت درمورد نظریه پردازی داده بنیاد
قالب بندی: پاورپوینت
تعداد اسلاید: 19
محتویات
روش تحقیق چیست
تاریخچه نظریه پردازی داده بنیاد
مفاهیم نظریه پردازی داده بنیاد
نظریه پردازی داده بنیاد
نمونه کدگذاری متمرکز
و . . .
قسمتی از پاورپوینت
روش تحقیق چیست
چگونگی کاربست ابزارهای تحقیق در کسب معرفت از منبع معرفت
تاریخچه نظریه پردازی داده بنیاد
مشخصات فایل
عنوان: پاورپوینت درمورد آمار سوم تجربیجلسه چهارم:داده ها
قالب بندی: پاورپوینت
تعداد اسلاید: 7
محتویات
قسمتی از پاورپوینت
اسلاید 1
نتایج حاصل از اندازه گیری و یا بررسی نمونه راداده می گوییم
روش های جمع آوری داده ها عبارتند از :
1- مستقیما از اشخاص (شفاهی ،مصاحبه)
2- پرسش نامه کتبی برای اینکه سوالات به طور یکسان پرسیده شود
اسلاید 2
از طریق مشاهده و ثبت وقایع
نکات مهمی در تهیه پرسش نامه
اسلاید 3
مشخصات فایل
عنوان: پاورپوینت درمورد بررسی ساختار سیستم اخذ داده
قالب بندی: پاورپوینت
تعداد اسلاید: 12
محتویات
مقدمه
تعریف سیستم اخذ داده
هدف انجام پروژه بلاک دیاگرام سیستمDAQ ( خطوط کنترلی مشخص نشده است.)
مدار حفاظت ولتاژ ورودی
بافر ورودی
تقویت کننده ابزار دقیق
مالتی پلکسر آنالوگ
مدار انتخابگر دیجیتالی بهره
تعریف سیستم اخذ داده
مشخصات فایل
عنوان: پاورپوینت درمورد اصول طراحی پایگاه داده ها
قالب بندی: پاورپوینت
تعداد اسلاید: 20
محتویات
سرفصل مطالب درس
نمایش ذخیرهشده اشیاء فیزیکی، چیزهای مجرد، بودهها، رویدادها یا چیزهای قابل مشاهده که در تصمیمسازی بکار میآیند.
هر نمایشی اعم از کاراکتری یا کمیتهای قیاسی که معنایی به آن قابل انتساب باشد.
مجموعهای است از دادههای ذخیره شده و پایا، به صورت مجتمع(یکپارچه) (نه لزوما فیزیکی، بلکه حداقل به طور منطقی)، بهم مرتبط، با کمترین افزونگی، تحت مدیریت یک سیستم کنترل متمرکز، مورد استفاده یک یا چند کاربر از یک یا بیش از یک ”سیستم کاربردی“، به طور همزمان و اشتراکی
و . . .