هوش مصنوعی و علم داده به فارسی
6.08K subscribers
982 photos
266 videos
318 files
1.06K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
معرفی تعدادی از کتابخانه‌های برتر پایتون در حوزه علم‌ داده

کتابخانه Scikit-learn: کتابخانه Scikit-learn یکی از محبوب‌ترین کتابخانه‌های یادگیری ماشین در پایتون است. این کتابخانه از طیف وسیعی از الگوریتم‌های طبقه‌بندی و خوشه‌بندی و… پشتیبانی می‌کند.

کتابخانه NumPy: با استفاده از این کتابخانه امکان استفاده از آرایه‌ها، ماتریس‌های بزرگ چند بعدی و استفاده از تابع‌های ریاضیاتی سطح بالا در پروژه‌های علم‌داده فراهم می‌شود.

کتابخانه Pandas: جهت کار با داده‌های ساختاریافته و آماده‌سازی دادگان از این کتابخانه محبوب استفاده می‌شود.

کتابخانه Matplotlib: کتابخانه Matplotlib جز معروف‌ترین کتابخانه‌های پایتون در حوزه Data Visualization است.

کتابخانه Seaborn: کتابخانه دیگر مطرح در حوزه مصورسازی داده‌ها در پایتون Seaborn است. طیف وسیعی از نمودارها در این کتابخانه پشتیانی می‌شود.

کتابخانه Tensorflow: جهت پیاده‌سازی مدل‌های مبتنی بر یادگیری عمیق بر فریم‌ورک تسنورفلو در زبان پایتون از کتابخانه Tensorflow می‌توانید استفاده کنید.

کتابخانه Theano: از دیگر کتابخانه‌ مطرح حوزه یادگیری عمیق می‌توان به لایبرری Theano اشاره کرد. کتابخانه Keras نیز با توجه به قابلیت‌های بالا آن نیز در حوزه یادگیری عمیق سهولت و کارایی بسیار بالایی دارد.

👈
{عضویت در کانال}👉
زهرا(س) شدی که نام علی(ع) را عَلَم کنی
پنهان شدی که هر دو جهان را حرم کنی

🏴 فرا رسیدن سالروز شهادت حضرت فاطمه‌ی‌ زهرا (سلام الله علیها) تسلیت‌ باد


@DataPlusScience
An_overview_of_key_companies,_resources.pdf
322.9 KB
An overview of key companies, resources and tools in data science

جدول تناوبی علم‌داده!

این جدول که توسط دیتاکمپ طراحی شده است به معرفی اصلی‌ترین برگزارکنندگان دوره‌ها،کنفرانس‌ها،مسابقات،زبان برنامه‌نویسی، ابزارهای مصورسازی، انجمن‌ها، ابزارها و الگوریتم‌های علم‌داده می‌پردازد.

👈{عضویت در کانال} 👉 | | 📩 : @Contact2Mebot
This media is not supported in your browser
VIEW IN TELEGRAM
هواپیمای بدون سرنشین آمازون که برای تحویل مکانیزه سفارشات توسط ربات‌ها طراحی شده!

@DataPlusScience
📚 معرفی #کتاب + پادکست خلاصه کتاب

کتاب "همه دروغ می‌گویند: عظیم‌داده، داده‌های جدید و اینترنت در مورد اینکه ما واقعا کیستیم چه چیزهایی را می‌توانند بگویند"

“Everybody Lies: Big Data, New Data, and What the Internet Can Tell Us About Who We Really Are”

📍 "همه دروغ می‌گویند" در سال 2017 به قلم استفن دیویدویتس و توسط انتشارات بلومزبری منتشر شده است. استیون پینکر، روانشناس معروف کانادایی می‌گوید: "این کتاب در مورد یک روش کاملا جدید از ذهن خوانی است."

📍 همه دروغ میگویند. به دوستان، به عشاق، دکترها، نظرسنجان و حتی به خودشان... با این وجود در جستجوهای اینترنتی، مردم به رازهایشان در مورد علایق شخصی، مشکلات سلامت روحی و یا حتی نقطه نظرات نژادپرستانه اعتراف می‌کنند. استفن دیویدویتس، اقتصاددان و تحلیلگر داده سابق شرکت گوگل نشان می‌دهد که این جستجوها، مهمترین مجموعه داده‌ای است که تا به حال جمع‌آوری شده‌است.

📍 این مجموعه عظیم‌داده بی‌سابقه از رازهای بشر در طول تاریخ، بینش‌های شگفت‌انگیز ، انقلابی و تکان‌دهنده‌ای نسبت به بشریت را بر ملاء می‌سازد. برای مثال، بعد از یک تهاجم تروریستی سطح عصبانیت و خشم عمومی افزایش نمی‌یابد؛ بلکه سطوح جنایت بعد از انتشار یک فیلم خشونت‌آمیز تا حد قابل توجهی افت می‌کند. و یا جستجوهای نژادپرستانه بیشتر از اینکه توسط جمهوری‌خواهان انجام شود توسط دموکرات‌ها انجام می‌شود.

📍 استفن دیویدویتس، اطلاعاتی را افشا می‌کند که می‌تواند به ما کمک کند تا فرهنگمان و سوالاتی را که برای سلامت روحی و جسمی ما ضروری هستند را تغییر دهیم. همه دروغ می‌گویند به طرزی نگرشی، خنده‌دار و غافلگیرکننده ، در عصری که همه چیز غیر قابل پیش‌بینی هستند، سوگیری‌ها و رازهایی را که در عمق ذهن ما وجود دارند را آشکار می‌کند.

از طریق لینک زیر می توانید به پادکست خلاصه کتاب دسترسی پیدا کنید:

t.me/DataPlusScience/539

👈{عضویت در کانال} 👉 | 📩 : @Contact2Mebot
BPlus Podcast Episode 3 : Everybody Lies
Ali Bandari
پادکست خلاصه کتاب "همه دروغ می‌گویند!"

کتاب EVERYBODY LIES یکی از کتاب‌های جذاب برای آشنایی با قابلیت‌های حوزه Big Data می‌باشد که توسط ست استفن‌دیویدویتز یکی از دانشمندان داده شرکت گوگل در جهت معرفی قابلیت‌های تحلیل‌داده منتشر گردیده است.

این محقق چهار سال را صرف تحلیل داده‌های ناشناس گوگل کرده است. تحقیقات او درباره موضوعاتی همچون بیماریهای روانی، سقط جنین، مذهب و پزشکی بوده است. او معتقد است که جستجوهای گوگل مهمترین پایگاه داده‌ای است که تاکنون در مورد روح و روان انسان وجود دارد.

در این کتاب مقایسه‌های مختلفی از جستجوهای کاربران موتور جستجو گوگل با نظرسنجی‌ها عمومی صورت گرفته است. نتایج این تحقیق نشان از وجود اختلاف میان این دو حوزه و ارزش تحلیل‌ اطلاعات در عصر جدید است.

@DataScience
💡 مسیر تبدیل شدن به یک متخصص علم داده

@DataScience
Corona dashboard[R]
داشبورد
آنلاین ویروس کرونا!

این #داشبورد که با زبان R و پکیج Shiny طراحی شده، بصورت آنلاین آمار شیوع ویروس کرونا را مصور کرده است.
http://dataatomic-tools.com/shiny/CoronaOutbreak/

@DataScience
💡 فلوچارت انتخاب الگوریتم یادگیری ماشین

@DataScience
💡 مسیر آموزشی علم‌داده!

📝 محمدرضا محتاط | @DataAnalysis

یکی از مهم‌ترین گام‌های تبدیل‌شدن به یک متخصص علم‌داده، انتخاب مسیر آموزشی بهینه جهت آموزش مفاهیم و ابزارهای کارآمد منطبق با بازار کار است. موضوعی که توسط مؤسسات و دوره‌های آموزشی که در کشور نیز در حال گسترش است کمتر به آن توجه می‌شود.

مسیر پیشنهادی زیر یکی از نمونه مسیرهای آموزشی مناسب جهت تبدیل‌شدن به یک متخصص علم‌داده و تحلیلگر کلان داده منطبق با بازار کار بین‌المللی و ایران هست.

🔵 بخش مقدماتی:

🔹پیش‌نیاز:
یکی از مهم‌ترین‌ پیش‌نیازهای ورود به حوزه علم‌داده فراگیری مفاهیم پایه حوزه‌های آمار، داده‌کاوی و... است. آموزش ساختار و قواعد زبان‌ برنامه‌نویسی پایتون، توانایی کار با پایگاه داده‌های رابطه‌ای و اجرای کوئری‌های SQL ای نیز از دیگر پیش‌نیاز کلیدی می‌باشد.

🔹
علم‌داده با پایتون:
پس از آموزش ساختار و قواعد زبان برنامه‌نویسی پایتون، در گام بعدی فراگیری کتابخانه‌های تحلیل داده این زبان برنامه‌نویسی حائز اهمیت است. کتابخانه‌ Pandas بابت تحلیل داده‌های ساخت‌یافته، کتابخانه Numpy جهت پیاده‌سازی مفاهیم پایه ریاضی و آمار، کتابخانه Matplotlib جهت مصورسازی داده‌ها، کتابخانه IPython جهت اجرای Interctive پروژه‌های علم‌داده و... در این گام مفید خواهد بود.

🔹
یادگیری ماشین:
در این گام هدف پیاده‌سازی و اجرای پروژه‌های یادگیری ماشین می‌باشد. کتابخانه Scikit learn از مطرح‌ترین کتابخانه‌های زبان پایتون است که به‌وسیله آن امکان پیاده‌سازی اکثر پروژه‌های یادگیری ماشین فراهم خواهد شد. آموزش تخصصی این کتابخانه در پروژه‌های موردی بسیار مفید است.

🔴
بخش پیشرفته:
در بخش پیشرفته تمرکز بر پلتفرم‌ها و ابزارهای نوظهور است که در صورت فراگیری آن امکان رشد بسیار سریع‌تر در این فیلد کاری میسر خواهد شد.

🔺
یادگیری عمیق:
با توجه به قابلیت‌های یادگیری عمیق در مسائل پیچیده، یادگیری فریم‌ورک‌ها و کتابخانه‌های یادگیری عمیق نقش به سزایی در موفقیت شما به‌عنوان یک متخصص علم‌داده خواهد داشت. کتابخانه‌های Tensorflow و Keras دو کتابخانه مطرح یادگیری عمیق هستند که آموزش یکی از این دو بسیار مفید خواهد بود. تمامی این کتابخانه‌ها دارای واسط برای زبان برنامه‌نویسی پایتون هستند.

🔺
کلان ‌داده:
با توجه به افزایش سرعت، حجم و تنوع اطلاعات، در حال حاضر دو جایگاه متخصص علم‌داده و تحلیلگر کلان داده به‌مراتب به یکدیگر نزدیک شده‌اند و بعضاً در فرصت‌های شغلی متخصصین علم‌داده توانایی‌های مرتبط با حوزه Big Data نیز از پیش‌نیازهای اصلی است. آشنایی با اکوسیستم Hadoop و زیر پروژه‌های آن همانند Pig, Sqoop, Hive و... در این بخش پیشنهاد می‌شود.

🔺
آپاچی اسپارک:
آپاچی اسپارک یکی از برترین پلتفرم‌های پردازشی در حوزه کلان داده است. فراگیری کتابخانه‌های یادگیری ماشین این پلتفرم(MLlib)، اجرای کوئری‌های SQL در این پلتفرم پردازشی (Sprak SQL) و... جهت رشد سریع‌تر شما در این حوزه کاری بسیار موثر است.

پی‌نوشت:
1- جهت یادگیری اصولی و کاهش پیچیدگی‌های آموزشی در این مسیر توصیه می‌کنم حتما گام‌ها به ترتیب طی شود. بعضاً برخی از علاقه‌مندان بدون دانش مقدماتی یا در شروع فرایندهای آموزشی به دنبال یادگیری مفاهیم و ابزارهای تخصصی یادگیری عمیق یا کلان داده می‌شوند. امری که سبب بروز پیچیدگی و کسب دانش سطحی خواهد شد.
2- انتخاب موسسه و دوره آموزشی مناسب یکی از کاتالیزورهای موفقیت شما در این مسیر آموزشی دشوار اما جذاب است.
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
به تازگی موسسه تحقیقاتی هوش مصنوعی فیسبوک (Facebook AI Research) کتابخانه ویژه جهت استفاده از یادگیری عمیق در آموزش تصاویر سه بعدی را ارایه نموده است.
پیش بینی می‌شود از این کتابخانه Pytorch3D در آینده در حوزه های مختلف به ویژه پزشکی و تصویربرداری های سه بعدی استفاده های گسترده خواهد شد.

منبع : ایران ام‌ال

@DataScience
Corona dashboard[R]
داشبورد
آنلاین ویروس کرونا!

این #داشبورد که با زبان R و پکیج Shiny طراحی شده، بصورت آنلاین آمار شیوع ویروس کرونا را مصور کرده است.
http://dataatomic-tools.com/shiny/CoronaOutbreak/

@DataScience