هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
262 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
💡 کدام کتاب را بخوانم و کدام منبع برای یادگیری من بهترین است؟

خیلی از مواقع برای یادگیری یک موضوع خاص در دنیای IT از کتاب های الکترونیک یا Ebookها استفاده میکنیم، اما معمولاً در مورد یک موضوع خاص چندین نسخه مختلف از این Ebookها در سطح اینترنت و یا گروه ها و کانال های تلگرامی به اشتراک گذاشته شده اند و در عنوان آنها عبارتی مانند: Essentials و Fundamentals و for Neibies و Deep Dive و Cookbook و... را مشاهده می‌کنید و شاید این سوال مطرح شود که: "کدام کتاب برای شروع کار و یادگیری من بهترین است؟".
در پاسخ به این سوال شاید مهمترین موضوع این باشد که "دانش" شما نسبت به آن موضوع در "چه سطحی" قرار دارد، یعنی به عنوان مثال شما هیچ دانشی و backgroundی از موضوع مورد نظر ندارید، کمی با موضوع آشنایی دارید ولی Conceptها را نمی دانید، Conceptها را می دانید ولی Config و پیاده سازی را بلد نیستید، هم Concept و هم Config را می دانید اما به دنبال تسلط بیشتر و انجام سناریوهای عملی و کاربردی هستید و... . پس از پاسخ به سوال مطرح شده مسلماً می توانید بهترین منبع را برای یادگیری Self-Study و Self-Learning خود در هر سطحی که هستید انتخاب نمایید.


📌 Essentials
که نشون میده این کتاب از base و پایه به موضوع مورد نظر می پردازه ولی تمامی مطالب به صورت "سطحی" نه "عمقی" مطرح می شوند، سناریو-محور نیستند و مثال های کاربردی کمی دارند. Conceptها کلی مطرح شده و به جزئیات توجه نمی شود و Configها نیز جامع نیستند. خواندن این کتاب ها وقت زیادی را از شما نمیگیرد و معمولاً این کتاب ها بسته به موضوع چیزی حدود 110 تا 300 صفحه دارند.

📌 Fundamentals
این کتاب ها معمولاً به "اصول پایه ای" یک موضوع یا مبحث خاص میپردازند، متدها را بررسی کرده و روش های مختلف اجرا (اما معمولاً بدون پیاده سازی) را مطرح می کنند.

📌 for Newbies
یعنی اینکه کتاب برای تازه کارها نوشته شده و اگر شخصی که داره کتاب رو میخونه قبلاً هم هیچ دانشی نداره مشکلی نیست و این کتاب در مورد موضوع مورد نظر پایین ترین سح ممکن رو در بین کتاب ها داره

📌 Deep Dive
یعنی (شیرچه عمیق) که توی یک مبحث خاص یا یک موضوع مشخص تا عمق زیاد وارد میشه و مطالبش سطحی نیستند و با جزئیات زیاد در مورد همه چیز گفته میشه در کتاب. وقتی میگن یه کتاب by details مطالب رو توضیح میده یعنی همین.

📌 Cookbook
این کتاب ها معمولاً شامل Concept + Config و مثال ها و سناریوها هستند، روش های troubleshootها رو میگن، راهکارهای مانیتورینگ رو، روش های backup گیری رو، روش های integrate کردن رو، پیشنیازها رو و... در مورد اون موضوع خاص، تقریباً میشه گفت کتاب های Cookbook از همه جهات به اون موضوع کتاب میپردازن

📌 Practical
اینها کتاب های عملیاتی هستند، دیگه نمیاد در مورد موضوع کتاب Concept رو معمولاً از base شروع کنه به گفتن و بعد بره سر Config و...، از همون اول شروع میکنه با سناریو و مثال های عملی و کاربردی مطالب رو دونه دونه جلو میره

📌 Playbook
یکسری راهکارها رو که بیشتر کاربرد دارند توی اون موضوع خاص سعی میکنه بگه بطوریکه درصد Concept به Config توی این کتاب ها 30 به 70 هست تقریباً

📌 Mastering
این کتاب ها تقریباً مثل کتاب های Cookbook هست ساختارشون که از همه جهت میان در مورد موضوع کتاب بحث میکنن و Concept و Config و... رو دارن ولی کمی مطالب رو دست بالاتر توضیح میدن نسبت به کتاب های Cookbook

📌 Advanced
این کتاب هم که شامل یکسری از مباحث پیشرفته در مورد موضوع خاصی هستند که توی کتاب های Cookbook و Mastering نمی بینمیشون معمولاً یا شاید توی اونها فقط اشاره ای بهشون شده ولی در کتاب های Avanced اون مبحث فوق تخصصی رو کاملاً باز میکنه و توضیح های کامل تر و جامع تری در موردش میاره

📌 Workbook
این کتاب ها هم کتاب های تمرینی هستند و برای افرادی خوبن که یک موضوع یا دوره رو خوندن و یاد گرفتند و حالا قصد دارند یکسری تمرینات رو انجام بدن بصورت عملی و بیشتر روی مباحث تسلط پیدا کنن و یا برای آزمون های بین المللی که به صورت "تست+LAB" هستند، برای بخش LAB آماده بشن

📌 Official
این کتاب ها معمولاً کتاب های "رسمی" یک vendor هستند و برای یادگیری در مورد یک دوره خاص مطرح می باشند و بیشترین سوالات نیز در آزمون بین المللی آن دوره خاص معمولاً از مطالبی که در همین کتاب ها آورده شده است، مطرح می شوند و بهترین و استانداردترین منبع برای مورد تأیید آن Vendor برای یادگیری موضوع مورد نظر هستند.

منبع: @BIMining

👈{عضویت در کانال}👉
تفاوت‌های علم داده و هوش تجاری

هوش تجاری تمرکز به گذشته و توصیف آنچه که رخ داده است دارد در حالی که علم داده توجه به آینده و پیش‌بینی آن را برعهده دارد
توجه به خودکارسازی در هوش تجاری بیش از علم داده است
هر نوع داده‌ای در علم داده مورد بررسی قرار می‌گیرد در حالی که در هوش تجاری داده‌های ساخت یافته مورد بهره برداری قرار می‌گیرد
از نتایج علم‌داده برای پیشنهاد برنامه‌های آتی استفاده می‌گردد و کاربرد هوش‌تجاری در پشتیبانی از تصمیمات مدیران است

👈{عضویت در کانال}👉
This media is not supported in your browser
VIEW IN TELEGRAM
🎞 Skills Needed For Data Scientist and Data Analyst

این ویدئو بعد از تعریف کوتاه تحلیلگر داده و دانشمند علم‌داده به مجموعه توانمندی‌هایی که هر یک باید داشته باشند میپردازه

👈{عضویت در کانال}👉
هوش مصنوعی و علم داده به فارسی
💡 فلوچارت انتخاب الگوریتم یادگیری ماشین @SyThinking | تفکر سیستمی
انتخاب الگوریتم مناسب در پروژه‌های داده‌کاوی!

یکی از چالش‌های مهم در پروژه‌های داده‌کاوی انتخاب الگوریتم مناسب و بهینه بنا به نیازمندی‌های مسئله است. در ادامه برخی از مؤلفه‌های کلیدی جهت انتخاب الگوریتم‌های یادگیری ماشین در یک پروژه داده‌کاوی ذکر خواهد گردید.

1- هدف تحلیل(متغیرهدف): هدف تحلیل و نوع متغیر هدف(Target) از مهم‌ترین مؤلفه‌های انتخاب الگوریتم و تکنیک موردنیاز خواهد بود. هر یک از تحلیل‌های توصیفی، پیش‌بینانه و... توسط الگوریتم‌های مشخصی پشتیبانی خواهند شد. به‌صورت کلی بنا به نوع متغیر هدف و تحلیل موردنیاز به الگوریتم‌های مختلفی همانند خوشه‌بندی، طبقه‌بندی، پیش‌بینی، کاهش بعد، قوانین انجمنی و... نیاز خواهد شد.

2-
دقت و صحت: در برخی از مسائل که هدف کسب دقت بالاتر می‌باشد برخی از الگوریتم‌ها همانند SVM، شبکه‌های عصبی، Random Forest و... به نسبت سایر الگوریتم‌ها پیشنهاد می‌شود.

3-
سرعت: در مسائلی که هدف سرعت بیشتر در مدل‌سازی است برخی الگوریتم‌ها همانند Naive Bayes، رگرسیون لوجستیک، رگرسیون خطی، درخت‌های تصمیم‌گیری و... عملکرد به‌مراتب بهتری نسبت به سایر الگوریتم‌ها دارند.

4-
دادگان نامتوازن: یکی از چالش‌های اساسی در پروژه‌های داده‌کاوی وجود دادگان نامتوازن در کلاس متغیر هدف است. جهت مدیریت دادگان نامتوازن روش‌های متعددی همانند OverSampling یا UnderSampling وجود دارد اما برخی از الگوریتم‌ها نیز توانایی مدیریت این قبیل دادگان را دارند. از مهم‌ترین الگوریتم‌هایی که توانایی مدیریت دادگان نامتوازن را دارند می‌توان به الگوریتم‌های Random Forset, C4.5, C5.0, CART و... اشاره کرد.

پی‌نوشت:
1- انتخاب یک الگوریتم به سایر مؤلفه‌ها همانند وجود تخصص لازم در تیم تحلیل داده و توانایی پیاده‌سازی آن، لزوم مشخص بودن یا نبودن قوانین کشف‌شده همانند روش‌های BlackBox در مقابل روش‌های Rule Base بستگی دارد.
2- ارائه راه‌حل‌های کلی معمولاً کارآمد نخواهد بود اما در حوزه‌ الگوریتم‌های یادگیری ماشین طبق تجربیات موجود در پروژه‌های مختلف دو الگوریتم SVM و Random Forest معمولاً دارای نتایج کارآمدتری هستند.

منبع
: کانال بیگ دیتا

👈{عضویت در کانال}👉
تفاوت‌های یادگیری با ناظر ( Supervised learning ) و یادگیری بدون ناظر ( Unsupervise learning )

👈{عضویت در کانال} 👉
This media is not supported in your browser
VIEW IN TELEGRAM
آینده تکنولوژی چه شکلی خواهد بود؟

هفت تکنولوژی که تا سال ۲۰۳۰ به نقطه اوج خود خواهند رسید.
مواردی مانند تکنولوژی ربات ها، اینترنت اشیا و سنسورها، تکنولوژی پزشکی و چاپ سه بعدی، اینترنت، موبایل‌های قابل کاشت در بدن، ماشین های اشتراکی و اجاره ماشین و هوش مصنوعی!

👈{عضویت در کانال}👉
داشبورد تحلیل عملکرد لیونل مسی طراحی شده با Power BI برای علاقمندان به فوتبال، مسی و البته #هوش_تجاری! 😊

داشبورد را اینجا ببینید

👈 عضویت در کانال 👉
🚨کانال زیر رو افتتاح کردیم و توش فقط فایل‌های آموزش دیتاساینس رو قرار می‌دیم، اگر خواستید عضو بشید:
👉 @Datascientists_Files
🏴سالروز شهادت
نهمین پیشوای شیعیان
ابن‌الرضا
حضرت جوادالائمه سلام ‌الله ‌علیه را

به‌ پیشگاه مقدس
امام‌ عصر عجل‌ الله‌ فرجه
وهمه‌شیعیانشان
تسلیت عرض می‌نماییم 🏴

👈 عضویت در کانال 👉
📌 کِی؟کجا؟چرا؟(یادگیری عمیق)
📝 زیبا پورقربان

توی چند ساله اخیر یادگیری عمیق به موفقیت های چشمگیری در زمینه های متفاوت دست یافته و افراد زیادی را علاقه مند به مطالعه در این زمینه کرده است، اما مسئله اصلی قبل از شروع به مطالعه، رسیدن به پاسخ سوالاتی مثل : یادگیری عمیق کجا کاربرد داره؟ کِی از یادگیری عمیق استفاده کنیم؟ چرا یادگیری عمیق؟ چالش های در رابطه با یادگیری عمیق؟و... تا جایگاه و اهمیت روش های یادگیری عمیق برای ما مشخص بشه که در ادامه این پست پاسخ سوالات را قرار دادم


کی از یادگیری عمیق استفاده کنیم ؟

_ نبود انسان‌های متخصص(ناوبری روی ماه)
_ انسان قادر به توضیح تخصص خود نباشد.(تشخیص گفتار، بینش و درک زبان)
_ راه حل مسئله با گذشت زمان تغییر کند.(ردیابی،پیش بینی آب و هوا، پیش بینی بورس و سهام)
_ راه حل هایی که باید با موارد خاص سازگار شوند.(بیومتریک، شخصی سازی)
_ استدلال انسان در مقابل حجم مسئله محدود باشد.(محاسبه رتبه وبسایت، مطابقت تبلیغات فیس‌بوک ، تحلیل احساسات)

چرا یادگیری عمیق؟

_ روش یادگیری جامع: تقریبا همه نوع مسئله ای را در زمینه های متفاوت حل می کند.
_ قدرتمندی: برخلاف یادگیری ماشین سنتی ویژگی های داده را به صورت خودکار استخراج می کند.
_ قابلیت تعمیم: می توان از دانش یک مدل آموزش دیده برای مدل با کاربرد یا نوع داده متفاوت استفاده کرد.
_ مقیاس پذیری: امکان پیاده سازی شبکه های وسیع(هزاران نورون و لایه) را فراهم می کند.


چالش های در رابطه با یادگیری عمیق؟

_ آنالیز کلان داده با یادگیری عمیق
_ مقایس پذیری روش های یادگیری عمیق
_ تولید داده زمانی که داده به اندازه کافی برای آموزش مدل در دسترس نیست.
_ تکنولوژی های کارآمد برای دستگاه های خاص مثل تلفن همراه هوشمند، FPGAو...
_ یادگیری انتقال و انجام چند وظیفه همزمان
_ سروکارداشتن با علت یادگیری

منبع

👈 عضویت در کانال 👉
💡 مسیر آموزشی علم‌داده!

📝 محمدرضا محتاط | @DataAnalysis

یکی از مهم‌ترین گام‌های تبدیل‌شدن به یک متخصص علم‌داده، انتخاب مسیر آموزشی بهینه جهت آموزش مفاهیم و ابزارهای کارآمد منطبق با بازار کار است. موضوعی که توسط مؤسسات و دوره‌های آموزشی که در کشور نیز در حال گسترش است کمتر به آن توجه می‌شود.

مسیر پیشنهادی زیر یکی از نمونه مسیرهای آموزشی مناسب جهت تبدیل‌شدن به یک متخصص علم‌داده و تحلیلگر کلان داده منطبق با بازار کار بین‌المللی و ایران هست.

🔵 بخش مقدماتی:

🔹پیش‌نیاز:
یکی از مهم‌ترین‌ پیش‌نیازهای ورود به حوزه علم‌داده فراگیری مفاهیم پایه حوزه‌های آمار، داده‌کاوی و... است. آموزش ساختار و قواعد زبان‌ برنامه‌نویسی پایتون، توانایی کار با پایگاه داده‌های رابطه‌ای و اجرای کوئری‌های SQL ای نیز از دیگر پیش‌نیاز کلیدی می‌باشد.

🔹
علم‌داده با پایتون:
پس از آموزش ساختار و قواعد زبان برنامه‌نویسی پایتون، در گام بعدی فراگیری کتابخانه‌های تحلیل داده این زبان برنامه‌نویسی حائز اهمیت است. کتابخانه‌ Pandas بابت تحلیل داده‌های ساخت‌یافته، کتابخانه Numpy جهت پیاده‌سازی مفاهیم پایه ریاضی و آمار، کتابخانه Matplotlib جهت مصورسازی داده‌ها، کتابخانه IPython جهت اجرای Interctive پروژه‌های علم‌داده و... در این گام مفید خواهد بود.

🔹
یادگیری ماشین:
در این گام هدف پیاده‌سازی و اجرای پروژه‌های یادگیری ماشین می‌باشد. کتابخانه Scikit learn از مطرح‌ترین کتابخانه‌های زبان پایتون است که به‌وسیله آن امکان پیاده‌سازی اکثر پروژه‌های یادگیری ماشین فراهم خواهد شد. آموزش تخصصی این کتابخانه در پروژه‌های موردی بسیار مفید است.

🔴
بخش پیشرفته:
در بخش پیشرفته تمرکز بر پلتفرم‌ها و ابزارهای نوظهور است که در صورت فراگیری آن امکان رشد بسیار سریع‌تر در این فیلد کاری میسر خواهد شد.

🔺
یادگیری عمیق:
با توجه به قابلیت‌های یادگیری عمیق در مسائل پیچیده، یادگیری فریم‌ورک‌ها و کتابخانه‌های یادگیری عمیق نقش به سزایی در موفقیت شما به‌عنوان یک متخصص علم‌داده خواهد داشت. کتابخانه‌های Tensorflow و Keras دو کتابخانه مطرح یادگیری عمیق هستند که آموزش یکی از این دو بسیار مفید خواهد بود. تمامی این کتابخانه‌ها دارای واسط برای زبان برنامه‌نویسی پایتون هستند.

🔺
کلان ‌داده:
با توجه به افزایش سرعت، حجم و تنوع اطلاعات، در حال حاضر دو جایگاه متخصص علم‌داده و تحلیلگر کلان داده به‌مراتب به یکدیگر نزدیک شده‌اند و بعضاً در فرصت‌های شغلی متخصصین علم‌داده توانایی‌های مرتبط با حوزه Big Data نیز از پیش‌نیازهای اصلی است. آشنایی با اکوسیستم Hadoop و زیر پروژه‌های آن همانند Pig, Sqoop, Hive و... در این بخش پیشنهاد می‌شود.

🔺
آپاچی اسپارک:
آپاچی اسپارک یکی از برترین پلتفرم‌های پردازشی در حوزه کلان داده است. فراگیری کتابخانه‌های یادگیری ماشین این پلتفرم(MLlib)، اجرای کوئری‌های SQL در این پلتفرم پردازشی (Sprak SQL) و... جهت رشد سریع‌تر شما در این حوزه کاری بسیار موثر است.

پی‌نوشت:
1- جهت یادگیری اصولی و کاهش پیچیدگی‌های آموزشی در این مسیر توصیه می‌کنم حتما گام‌ها به ترتیب طی شود. بعضاً برخی از علاقه‌مندان بدون دانش مقدماتی یا در شروع فرایندهای آموزشی به دنبال یادگیری مفاهیم و ابزارهای تخصصی یادگیری عمیق یا کلان داده می‌شوند. امری که سبب بروز پیچیدگی و کسب دانش سطحی خواهد شد.
2- انتخاب موسسه و دوره آموزشی مناسب یکی از کاتالیزورهای موفقیت شما در این مسیر آموزشی دشوار اما جذاب است.
This media is not supported in your browser
VIEW IN TELEGRAM
ربات جالبی که در فرودگاه دنور نصب شده است و با بهره‌گیری از هوش مصنوعی با مسافران این فرودگاه مکالمه و شوخی می‌کند!

👈{عضویت در کانال}👉
Data Science.pdf
6.7 MB
علم‌داده از تئوری تا بازار کار

در این فایل که توسط محمدرضا محتاط ارائه شده است به مباحث زیر پرداخته شده است:

1.مفاهیم حوزه علم داده
2. مهارت ها و ابزارهای مورد نیاز جهت تبدیل شدن به یک دانشمند علم داده
۳. معرفی دوره های آنلاین برتر، کتاب های مرجع و مسابقات مطرح مرتبط با حوزه علم داده
4.تحلیل بازار کار ایران و معرفی مشاغل جذاب مرتبط با علم داده در آن

@DataScience
🚨کانال زیر رو افتتاح کردیم و توش فقط فایل‌های آموزش دیتاساینس رو قرار می‌دیم، اگر خواستید عضو بشید:
👉 @Datascientists_Files
۲۰ توانمندی #دانشمند_داده که بیشترین تقاضا را در آگهی های استخدامی به خود اختصاص داده اند.

Source: goo.gl/2XJmtS

@SyThinking | تفکر سیستمی