هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
263 videos
317 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
تحلیل احساسات در عکس و‌ ویدئو یکی از کاربردهای جالب یادگیری عمیق هستش.
تو این ‌ویدئو تشخیص احساس نفرات حاضر در قاب دوربین رو می‌بینیم.


@SyThinking
🚨 سایتی برای دانلود رایگان کورس‌های آموزشی

توی این سایت میتونید به خیلی از کورس های آموزشی سایت های مطرح مثل Lynda, Udemy, Packt, pluralsight و ... دسترسی پیدا کنید:

https://www.freetuts.download/

@SyThinking | تفکر سیستمی
Data Skills for Digital Era.pdf
2.6 MB
ارائه مفید مهارت‌های داده‌ای در عصر دیجیتال!

در ارائه فوق که توسط استاد محمدرضا محتاط ارائه گردیده، مهارت‌های مورد نیاز جهت تبدیل شدن به متخصص‌‌ حوزه‌های زیر به تفکیک ذکر گردیده است.

1- علم‌داده
2- هوش تجاری
3- کلان‌داده
4- مهندس داده

@DataScience
.
🚨 هوش مصنوعی و اکتشافات علمی جدید بر اساس مقالات قدیمی

💡 پژوهشگران همه روزه قابلیت‌های جدیدی از «هوش مصنوعی» (Artificial Intelligence) را کشف می‌کنند که به بهبود زندگی بشر کمک شایان توجهی می‌کند. در یکی از جدیدترین پژوهش‌های انجام شده در حوزه هوش مصنوعی، پژوهشگران موفق شده‌اند الگوریتم یادگیری ماشینی طراحی کنند که با استفاده از مقالات قدیمی به انجام اکتشافات علمی جدید می‌پردازد.

ابن الگوریتم یادگیری ماشین، توانسته است تنها با بهره‌گیری از زبان (ادبیات پژوهش) موجود در میلیون‌ها مقاله علمی قدیمی، اکتشافات علمی کاملا جدیدی داشته باشد. در پژوهشی که سوم جولای سال 2۰1۹ در نشریه هفتگی جامع «نِیچِر» (Nature) چاپ شده و حاصل کار پژوهشگرانی از «آزمایشگاه ملی لارنس برکلی» (Lawrence Berkeley National Laboratory) است، از الگوریتم Word2Vec به عنوان روشی نام برده شده که برای برقراری ارتباط بین مفاهیم موجود در مقالات قدیمی و کشف آنچه از نظر انسان‌ها دور مانده استفاده شده است. پژوهشگران آزمایشگاه لارنس، از این الگوریتم برای وارسی مقالات علمی قدیمی جهت کشف ارتباطات موجود در آن‌ها که از چشم انسان دور مانده، استفاده کرده‌اند.

الگوریتم «Word2Vec» پس از بررسی مقالاتی که به آن داده شده، توانسته است پیش‌بینی‌هایی را پیرامون مواد «ترموالکتریک» (Thermoelectric) احتمالی انجام دهد (موادی که احتمالا دارای خصوصیت مواد ترموالکتریک هستند) که گرما را به انرژی تبدیل می‌کنند و در بسیاری از کاربردهای گرمایشی و سرمایشی مورد استفاده قرار می‌گیرند. این در حالی است که الگوریتم مذکور درکی از مفهوم ترموالکتریک نداشته است. این الگوریتم تنها با استفاده از ارتباطات موجود میان کلمات، کاندیداهایی احتمالی برای مواد ترموالکتریک آتی که کشف خواهند شد را پیش‌بینی کرده است. امکان دارد این کاندیداها حتی از مواد ترموالکتریک کنونی که در زمینه‌های مختلف استفاده می‌شوند نیز بهتر باشند.


@SyThinking | تفکر سیستمی
باید غبار صحن تو را توتیا کنند
«آنان که خاک را به نظر کیمیا کنند»

هو هوی باد نیست که پیچیده در رواق
خیل ملائکند رضا یا رضا کنند

«هرگز نمیرد آنکه دلش» جَلد مشهد است
حتی اگر که بال و پرش را جدا کنند

هر کس به مشهد آمد و حاجت گرفت و رفت
او را به درد کرب و بلا مبتلا کنند

از آن حریم قدسی‌ات آقای مهربان!
«آیا شود که گوشهٔ چشمی به ما کنند؟»

🌺🌹 سالروز میلاد شمس‌الشموس، حضرت علی ابن موسی الرضا (ع) مبارک باد. 🌷🌸
.
💡 تفاوت های آمار و احتمال با داده‌کاوی و یادگیری ماشین

🔹 علم آمار و احتمال مبتنی بر نمونه گیری هستند ولی داده‌کاوی و یادگیری ماشین، مبتنی بر تحلیل کل جامعه

🔸 در علم آمار و احتمال، ابتدا فرضیه مطرح می شود و سپس برای اثبات یا رد فرضیه داده پیرامون فرضیه جمع آوری می شود حال آنکه در داده کاوی بر اساس الگوی ذاتی نهفته در داده ها، دانش و الگوی کسب شده تفسیر می شود.
آمار
: تئوری => داده داده کاوی: داده => تئوری

🔹 تعداد ویژگی ها در آمار محدود بوده ولی در داده کاوی امکان پردازش داده ها با ویژگی های بزرگ نیز هستد.

🔸 فرض اولیه اساسی در آمار، نرمال بودن داده هاست، در داده کاوی، چنین فرضی وجود ندارد.

🔹 داده های آماری به جز در مواردی که خطای انسانی دخیل است، نیاز به پیش‌پردازش سنگینی ندارند ولی در داده کاوی معمولا بیشتر زمان داده کاو صرف پیش پردازش داده ها می شود.

@SyThinking | تفکر سیستمی
هوش مصنوعی و علم داده به فارسی
منابعی فارسی برای یادگیری رایگان علم‌‌داده @SyThinking
📊 نگاهی به ابزارهای هر یک از مراحل علم‌داده

👈{عضویت در کانال}👉
💡 کدام کتاب را بخوانم و کدام منبع برای یادگیری من بهترین است؟

خیلی از مواقع برای یادگیری یک موضوع خاص در دنیای IT از کتاب های الکترونیک یا Ebookها استفاده میکنیم، اما معمولاً در مورد یک موضوع خاص چندین نسخه مختلف از این Ebookها در سطح اینترنت و یا گروه ها و کانال های تلگرامی به اشتراک گذاشته شده اند و در عنوان آنها عبارتی مانند: Essentials و Fundamentals و for Neibies و Deep Dive و Cookbook و... را مشاهده می‌کنید و شاید این سوال مطرح شود که: "کدام کتاب برای شروع کار و یادگیری من بهترین است؟".
در پاسخ به این سوال شاید مهمترین موضوع این باشد که "دانش" شما نسبت به آن موضوع در "چه سطحی" قرار دارد، یعنی به عنوان مثال شما هیچ دانشی و backgroundی از موضوع مورد نظر ندارید، کمی با موضوع آشنایی دارید ولی Conceptها را نمی دانید، Conceptها را می دانید ولی Config و پیاده سازی را بلد نیستید، هم Concept و هم Config را می دانید اما به دنبال تسلط بیشتر و انجام سناریوهای عملی و کاربردی هستید و... . پس از پاسخ به سوال مطرح شده مسلماً می توانید بهترین منبع را برای یادگیری Self-Study و Self-Learning خود در هر سطحی که هستید انتخاب نمایید.


📌 Essentials
که نشون میده این کتاب از base و پایه به موضوع مورد نظر می پردازه ولی تمامی مطالب به صورت "سطحی" نه "عمقی" مطرح می شوند، سناریو-محور نیستند و مثال های کاربردی کمی دارند. Conceptها کلی مطرح شده و به جزئیات توجه نمی شود و Configها نیز جامع نیستند. خواندن این کتاب ها وقت زیادی را از شما نمیگیرد و معمولاً این کتاب ها بسته به موضوع چیزی حدود 110 تا 300 صفحه دارند.

📌 Fundamentals
این کتاب ها معمولاً به "اصول پایه ای" یک موضوع یا مبحث خاص میپردازند، متدها را بررسی کرده و روش های مختلف اجرا (اما معمولاً بدون پیاده سازی) را مطرح می کنند.

📌 for Newbies
یعنی اینکه کتاب برای تازه کارها نوشته شده و اگر شخصی که داره کتاب رو میخونه قبلاً هم هیچ دانشی نداره مشکلی نیست و این کتاب در مورد موضوع مورد نظر پایین ترین سح ممکن رو در بین کتاب ها داره

📌 Deep Dive
یعنی (شیرچه عمیق) که توی یک مبحث خاص یا یک موضوع مشخص تا عمق زیاد وارد میشه و مطالبش سطحی نیستند و با جزئیات زیاد در مورد همه چیز گفته میشه در کتاب. وقتی میگن یه کتاب by details مطالب رو توضیح میده یعنی همین.

📌 Cookbook
این کتاب ها معمولاً شامل Concept + Config و مثال ها و سناریوها هستند، روش های troubleshootها رو میگن، راهکارهای مانیتورینگ رو، روش های backup گیری رو، روش های integrate کردن رو، پیشنیازها رو و... در مورد اون موضوع خاص، تقریباً میشه گفت کتاب های Cookbook از همه جهات به اون موضوع کتاب میپردازن

📌 Practical
اینها کتاب های عملیاتی هستند، دیگه نمیاد در مورد موضوع کتاب Concept رو معمولاً از base شروع کنه به گفتن و بعد بره سر Config و...، از همون اول شروع میکنه با سناریو و مثال های عملی و کاربردی مطالب رو دونه دونه جلو میره

📌 Playbook
یکسری راهکارها رو که بیشتر کاربرد دارند توی اون موضوع خاص سعی میکنه بگه بطوریکه درصد Concept به Config توی این کتاب ها 30 به 70 هست تقریباً

📌 Mastering
این کتاب ها تقریباً مثل کتاب های Cookbook هست ساختارشون که از همه جهت میان در مورد موضوع کتاب بحث میکنن و Concept و Config و... رو دارن ولی کمی مطالب رو دست بالاتر توضیح میدن نسبت به کتاب های Cookbook

📌 Advanced
این کتاب هم که شامل یکسری از مباحث پیشرفته در مورد موضوع خاصی هستند که توی کتاب های Cookbook و Mastering نمی بینمیشون معمولاً یا شاید توی اونها فقط اشاره ای بهشون شده ولی در کتاب های Avanced اون مبحث فوق تخصصی رو کاملاً باز میکنه و توضیح های کامل تر و جامع تری در موردش میاره

📌 Workbook
این کتاب ها هم کتاب های تمرینی هستند و برای افرادی خوبن که یک موضوع یا دوره رو خوندن و یاد گرفتند و حالا قصد دارند یکسری تمرینات رو انجام بدن بصورت عملی و بیشتر روی مباحث تسلط پیدا کنن و یا برای آزمون های بین المللی که به صورت "تست+LAB" هستند، برای بخش LAB آماده بشن

📌 Official
این کتاب ها معمولاً کتاب های "رسمی" یک vendor هستند و برای یادگیری در مورد یک دوره خاص مطرح می باشند و بیشترین سوالات نیز در آزمون بین المللی آن دوره خاص معمولاً از مطالبی که در همین کتاب ها آورده شده است، مطرح می شوند و بهترین و استانداردترین منبع برای مورد تأیید آن Vendor برای یادگیری موضوع مورد نظر هستند.

منبع: @BIMining

👈{عضویت در کانال}👉
تفاوت‌های علم داده و هوش تجاری

هوش تجاری تمرکز به گذشته و توصیف آنچه که رخ داده است دارد در حالی که علم داده توجه به آینده و پیش‌بینی آن را برعهده دارد
توجه به خودکارسازی در هوش تجاری بیش از علم داده است
هر نوع داده‌ای در علم داده مورد بررسی قرار می‌گیرد در حالی که در هوش تجاری داده‌های ساخت یافته مورد بهره برداری قرار می‌گیرد
از نتایج علم‌داده برای پیشنهاد برنامه‌های آتی استفاده می‌گردد و کاربرد هوش‌تجاری در پشتیبانی از تصمیمات مدیران است

👈{عضویت در کانال}👉
This media is not supported in your browser
VIEW IN TELEGRAM
🎞 Skills Needed For Data Scientist and Data Analyst

این ویدئو بعد از تعریف کوتاه تحلیلگر داده و دانشمند علم‌داده به مجموعه توانمندی‌هایی که هر یک باید داشته باشند میپردازه

👈{عضویت در کانال}👉
هوش مصنوعی و علم داده به فارسی
💡 فلوچارت انتخاب الگوریتم یادگیری ماشین @SyThinking | تفکر سیستمی
انتخاب الگوریتم مناسب در پروژه‌های داده‌کاوی!

یکی از چالش‌های مهم در پروژه‌های داده‌کاوی انتخاب الگوریتم مناسب و بهینه بنا به نیازمندی‌های مسئله است. در ادامه برخی از مؤلفه‌های کلیدی جهت انتخاب الگوریتم‌های یادگیری ماشین در یک پروژه داده‌کاوی ذکر خواهد گردید.

1- هدف تحلیل(متغیرهدف): هدف تحلیل و نوع متغیر هدف(Target) از مهم‌ترین مؤلفه‌های انتخاب الگوریتم و تکنیک موردنیاز خواهد بود. هر یک از تحلیل‌های توصیفی، پیش‌بینانه و... توسط الگوریتم‌های مشخصی پشتیبانی خواهند شد. به‌صورت کلی بنا به نوع متغیر هدف و تحلیل موردنیاز به الگوریتم‌های مختلفی همانند خوشه‌بندی، طبقه‌بندی، پیش‌بینی، کاهش بعد، قوانین انجمنی و... نیاز خواهد شد.

2-
دقت و صحت: در برخی از مسائل که هدف کسب دقت بالاتر می‌باشد برخی از الگوریتم‌ها همانند SVM، شبکه‌های عصبی، Random Forest و... به نسبت سایر الگوریتم‌ها پیشنهاد می‌شود.

3-
سرعت: در مسائلی که هدف سرعت بیشتر در مدل‌سازی است برخی الگوریتم‌ها همانند Naive Bayes، رگرسیون لوجستیک، رگرسیون خطی، درخت‌های تصمیم‌گیری و... عملکرد به‌مراتب بهتری نسبت به سایر الگوریتم‌ها دارند.

4-
دادگان نامتوازن: یکی از چالش‌های اساسی در پروژه‌های داده‌کاوی وجود دادگان نامتوازن در کلاس متغیر هدف است. جهت مدیریت دادگان نامتوازن روش‌های متعددی همانند OverSampling یا UnderSampling وجود دارد اما برخی از الگوریتم‌ها نیز توانایی مدیریت این قبیل دادگان را دارند. از مهم‌ترین الگوریتم‌هایی که توانایی مدیریت دادگان نامتوازن را دارند می‌توان به الگوریتم‌های Random Forset, C4.5, C5.0, CART و... اشاره کرد.

پی‌نوشت:
1- انتخاب یک الگوریتم به سایر مؤلفه‌ها همانند وجود تخصص لازم در تیم تحلیل داده و توانایی پیاده‌سازی آن، لزوم مشخص بودن یا نبودن قوانین کشف‌شده همانند روش‌های BlackBox در مقابل روش‌های Rule Base بستگی دارد.
2- ارائه راه‌حل‌های کلی معمولاً کارآمد نخواهد بود اما در حوزه‌ الگوریتم‌های یادگیری ماشین طبق تجربیات موجود در پروژه‌های مختلف دو الگوریتم SVM و Random Forest معمولاً دارای نتایج کارآمدتری هستند.

منبع
: کانال بیگ دیتا

👈{عضویت در کانال}👉
تفاوت‌های یادگیری با ناظر ( Supervised learning ) و یادگیری بدون ناظر ( Unsupervise learning )

👈{عضویت در کانال} 👉
This media is not supported in your browser
VIEW IN TELEGRAM
آینده تکنولوژی چه شکلی خواهد بود؟

هفت تکنولوژی که تا سال ۲۰۳۰ به نقطه اوج خود خواهند رسید.
مواردی مانند تکنولوژی ربات ها، اینترنت اشیا و سنسورها، تکنولوژی پزشکی و چاپ سه بعدی، اینترنت، موبایل‌های قابل کاشت در بدن، ماشین های اشتراکی و اجاره ماشین و هوش مصنوعی!

👈{عضویت در کانال}👉