علم داده دانشی میان رشتهای پیرامون استخراج دانش و آگاهی از مجموعهای داده و اطلاعات است. علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روشهای موجود در حوزههای مختلف علمی بنا شدهاست. تعدادی از این حوزهها عبارتند از: ریاضیات، آمار، مهندسی داده، بازشناخت الگو و… هدف این علم، استخراج مفهوم از داده و تولید محصولات دادهمحور است.عبارت علم داده بیش از یک دهه است که موجودیت دارد. ویلیام کلیولند اولین کسی است که اصطلاح علم داده را در سال ۲۰۰۱ مطرح کرده است. وی در مقاله علم داده برنامهای برای گسترش جنبههای فنی در رشته آمار پیشنهاد کرد که علم داده به عنوان یک رشته مستقل شناخته شود. کلیولند این رشته جدید را مرتبط با علوم کامپیوتر و دادهکاوی میدانست. وی بر این باور بود که منافع استفاده از یک تحلیلگر داده محدود است. چون مهندسین کامپیوتر شناخت کمی از روشهای کار با داده دارند و دانش محاسباتی متخصصین آمار هم محدود است بنابراین تلفیق این دو گروه میتواند منجر به نوآوریهای زیادی شود. دپارتمانهای علم داده باید اساتیدی داشته باشد که بتوانند دانش دادهها را با دانش محاسبات تلفیق کنند. آقایان توماس دونپورت و دی جی پاتیل در سال ۲۰۱۲ در مقاله علم داده جذاب ترین شغل قرن بیست و یکم متخصصین علم داده را این طور تعریف میکنند, کسانی که میدانند چگونه میتوان از انبوه اطلاعات بدون ساختار پاسخ سوالهای کسبوکار را پیدا کرد. استنتون در سال ۲۰۱۳ علم داده را این طور تعریف میکند: علم داده رشته در حال ظهوری است که به جمعآوری، آمادهسازی، تحلیل، بصریسازی، مدیریت و نگهداشت اطلاعات در حجم بالا میپردازد. دریسکول در سال ۲۰۱۴ علم داده را این طور تعریف میکند: علم داده مهندسی عمران دادههاست. متخصص علم داده دانشی کاربردی از دادهها و ابزارها دارد به علاوه درک تئوریکی دارد که مشخص میکند چه چیزی از نظر علمی ممکن است.
R یک زبان برنامهنویسی و محیط نرمافزاری برای محاسبات آماری و علم دادهها است، که بر اساس زبانهای اس و اسکیم پیادهسازی شده است. این نرمافزار متن باز، تحت اجازهنامه عمومی همگانی گنو عرضه شده و به رایگان قابل دسترس است. زبان اس بجز R، توسط شرکت Insightful، در نرمافزار تجاری اسپلاس نیز پیادهسازی شده است. اگرچه دستورات اسپلاس و R بسیار شبیه است لیکن این دو نرمافزار دارای هستههای متمایزی میباشند. R، حاوی محدودهٔ گستردهای از تکنیکهای آماری از جمله: مدلسازی خطی و غیرخطی، آزمونهای کلاسیک آماری، تحلیل سریهای زمانی، ردهبندی، خوشهبندی و غیره و قابلیتهای گرافیکی است. در محیط R، کدهای سی، سی++ و فورترن قابلیت اتصال و فراخوانی هنگام اجرای برنامه را دارند و کاربران خبره میتوانند توسط کدهای سی، مستقیماً اشیا R را تغییر دهند. گرچه نرمافزار R اغلب به منظور انجام محاسبات آماری به کار میرود، این نرمافزار قابل به کارگیری در محاسبات ماتریسی است و در این زمینه، همپای نرمافزارهایی چون اُکتاو و نسخهٔ تجاری آن متلب (MATLAB) است. R، همچنین نرمافزار قدرتمندی برای ایجاد اشکال گرافیکی و نمودارهاست. امکان توسعهٔ قابلیتهای R، با افزودن بستههای ایجاد شده توسط کاربران آن، یکی از ویژگیهای مهم این نرمافزار است. این بستهها توسط R، LaTeX، جاوا، سی++ و فورترن نوشته شدهاند. مجموعهای از بستههای اصلی R، هنگام نصب همراه برنامه وجود دارند و در مجموع ۴۴۴۲ بسته در شبکهٔ بایگانی فراگیر آر (CRAN) وجود دارد. این بستهها طیف وسیعی از قابلیتها را در زمینههای مختلف تحلیل دادهها به R میدهند. فیلم آموزشی OReilly Learning Path Introduction To Data Science With R توسط یکی از بهترین مدرسین طراح و برنامه نویس بنام Garrett Grolemund طراحی شده و کمپانی مشهور OReilly این مجموعه آموزشی را برای عموم عرضه کرد . امیدواریم که از دانلود فیلم آموزش مقدماتی علوم داده با آر لذت ببرید .
مشخصات فیلم آموزشی OReilly Learning Path Introduction To Data Science With R :
– ژانر : آموزشی
– شرکت سازنده : OReilly
– مدرس : Garrett Grolemund
– پروژه تمرینی : ندارد
– مدت زمان آموزش : 20 ساعت و 19 دقیقه
– زبان : انگلیسی
– کیفیت نمایش : 720×1280
– فرمت فایل : Mp4
– زیرنویس انگلیسی : ندارد
– زیرنویس فارسی : ندارد
سرفصل های فیلم آموزشی OReilly Learning Path Introduction To Data Science With R :
– مقدمه ای بر علم اطلاعات با R
– زبان آر 1
– زبان آر 2
– تجسم داده
– تنظیم نمودارها
– داده های مرتب
– تبدیل داده
– مبانی مدل سازی
– مدل سازی پیشرفته
– یادگیری بیشتر
شما از این پس می توانید فیلم های مورد نظرتان را در فروم دانلود فارسی ثبت نمایید