• AI & Python •
21.1K subscribers
1.05K photos
385 videos
63 files
582 links
••• علاقه‌مند به دنیای هوش مصنوعی، تحول دیجیتال و زبان برنامه‌نویسی پایتون با نیم نگاهی به حوزه شبکه و
امنیت.

Library & archive: @SecBookSs

تبلیغات:
@n_h_raad


.
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
⬅️ نقشه راه یادگیری علم داده

⏯️ ریاضیات: تاکید بر جبر خطی، محاسبه و مفاهیم آماری.

2️⃣ برنامه‌نویسی: استفاده از پایتون و آر، مدیریت پایگاه‌های داده و استفاده از گیت.

3️⃣ احتمالات: درک توزیع‌ها و متغیرهای تصادفی.

4️⃣ آمار: یادگیری در مورد نمونه‌برداری داده، آزمون فرض و ANOVA.

5️⃣ بصری‌سازی داده: استفاده از ابزارهایی مانند Qlik Sense برای ایجاد بینش‌های بصری.

6️⃣ یادگیری ماشین: پیشرفت از مبانی تا مفاهیم پیشرفته مانند مدیریت نشت داده.

7️⃣ مهندسی ویژگی: بهبود مدل‌ها با انتخاب و کدگذاری ویژگی‌ها.

8️⃣ پردازش زبان طبیعی: تحلیل متن از طریق طبقه‌بندی و بردارها.

9️⃣ یادگیری عمیق: ساخت مدل‌های پیچیده با TensorFlow و PyTorch.

0️⃣⏯️ راه‌اندازی: استفاده از پلتفرم‌هایی مانند Azure و ابزارهایی مانند Flask.

#DataScience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🤯2
✏️ فهرست بزرگی از منابع برای تمرین علم داده

• مجموعه‌ای از کتابخانه‌های پایتون، لینک آموزش ها، لینک نمونه کدها برای حل مشکلات DS.

👨‍💻 https://github.com/r0f1/datascience

#علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2👏1
matt-harrison-effective-pandas-patterns-for-data-2021.pdf
38.1 MB
📕 Effective Pandas

🔖 کتابخونه pandas یکی از مهم‌ترین و اصلی‌ترین کتابخونه‌های پیش‌پردازش داده‌ها و کار با Data Frame هاست. مسلط شدن به pandas برای کسانی که در حوزه دیتا کار می‌کنن، یک نیاز واجب و ضروریه.

نویسنده این کتاب، آقای مت هریسون، در این اثر ارزشمند به تفصیل pandas رو توضیح میده و نکته مبهم و سخن نگفته‌ای رو باقی نمی‌ذاره.

مطالعه این کتاب فوق‌العاده از این نویسنده بسیار توانمند رو به کسانی که قصد تسلط و درک عمیق pandas رو دارن، بسیار پیشنهاد می‌کنیم.

#علم_داده #Pandas #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🗿2
🖥 توی این ریپو یه مجموعه غنی و کامل از سوالاتی که موقع مصاحبه برای موقعیت شغلی Data Scientist مطرح شده به همراه جوابشون، جمع‌آوری شده.

و از زوایای زیر هم دسته بندی شدن:

🔢 یادگیری ماشین و یادگیری عمیق که موضوعاتی از قبیل جنگل‌های تصادفی، رگراسیون خطی، Loss Function , Cost Function, SVM , Active Learning و ...

🔢 آمار و احتمال شامل سوالاتی درباره آزمون فرض، قضیه حد مرکزی و توزیع داده‌ها و ...

🔢 پایتون با مشکلات و چالش‌های مرتبط با داده‌ها با استفاده از کتابخانه‌هایی مانند Pandas معروف و ...

🔢 پایگاه داده و SQL با سوالات متمرکز بر بازیابی داده و تجزیه و تحلیل داده.

🔢 سوالات مبتنی بر رزومه

💡در کل اگر برای مصاحبه با موقعیت Data Scientist آماده می‌شید، این مخزن می‌تونه منبع مفیدی باشه تا با سوالات رایج معمول و مهارت‌های حل مسئله خود آشنا بشید.

🧑‍💻 GitHub Link

#DataScience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤯2👏1
🔖 دستورات مهم Pandas و Spark برای علم‌داده

#علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2👏1
25 معادله ریاضی پرکاربرد در علم داده

#علم_داده #DataScience #دیتا_ساینس
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍42👏1
📝 برگه تقلب Numpy برای علم داده

#علم_داده #DataScience #Numpy #Python #پایتون
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👎1🔥1
📱 کتابخانه‌های پایتون برای علم داده

پایتون یکی از زبان‌های برنامه‌نویسی محبوب در حوزه علم داده است و دلیل این محبوبیت، وجود کتابخانه‌های قدرتمند و متنوع برای انجام تحلیل داده‌ها، مدلسازی آماری، یادگیری ماشین و بصری‌سازی داده‌ها است.
برخی از مهم‌ترین این کتابخانه‌ها عبارتند از:

1️⃣ NumPy: برای کار با آرایه‌های چندبعدی و انجام عملیات ریاضی پیچیده.

2️⃣ Pandas: برای دستکاری و تحلیل داده‌ها در قالب داده‌سازها.

3️⃣ Matplotlib و Seaborn: برای رسم نمودارها و بصری‌سازی داده‌ها.

4️⃣ Scikit-Learn: برای انجام یادگیری ماشین و مدل‌های پیش‌بینی.

5️⃣ TensorFlow و Keras: برای ساخت و آموزش مدل‌های شبکه‌های عصبی.

6️⃣ SciPy: برای انجام محاسبات علمی و فنی پیشرفته در علم داده استفاده می‌شود.

⬅️ این کتابخانه‌ها ابزارهای قدرتمندی هستند که به متخصصین علم داده کمک می‌کنند تا داده‌ها را به شکل بهینه‌تر تحلیل و مدل‌سازی کنند.

#برنامه_نویسی #پایتون #Python #Programming #علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2👎1👏1🙏1🦄1
📱 پایتون زبان اول GitHub شد!

✔️ در گزارشی اخیرا در GitHub، با گسترش هوش مصنوعی، پایتون سرانجام می‌تواند جاوااسکریپت را پشت سر بگذارد و محبوب‌ترین زبان در GitHub در سال 2024 شود. این اتفاق پس از 10 سال تسلط جاوااسکریپت رخ داده و عجیب نیست.

🧠 زیرا با رشد هوش مصنوعی، توسعه‌دهندگان بیش از هر زمان دیگری به پایتون روی می‌آورند و کاربردهای پایتون در علوم داده و تحلیل‌ها هر روز در حال افزایش است. می‌توانید گزارش کامل GitHub را اینجا بخوانید:
🐱 Top programming along GitHub
💰 Report

مهم‌ترین کتابخانه‌های پایتون برای کار با داده و هوش مصنوعی را اینجا معرفی کرده‌ام: 👇

🖥 دستکاری و تحلیل داده
▶️ pandas
▶️ Apache Spark
▶️ Polars
▶️ DuckDB

📊 مصورسازی داده
➡️ matplotlib
➡️ plotly
➡️ seaborn

🖥 یادگیری ماشین و یادگیری عمیق
➡️ TensorFlow
➡️ PyTorch
➡️ Keras
➡️ scikit-learn
➡️ XGBoost
➡️ LightGBM
➡️ Prophet

🌫 پردازش زبان طبیعی و مدل‌های زبانی بزرگ
➡️ Hugging Face Transformers
➡️ LangChain
➡️ LlamaIndex

#برنامه_نویسی #پایتون #Python #هوش_مصنوعی #یادگیری_ماشین #یادگیری_عمیق #علم_داده #جاوااسکریپت #DataScience #Programming #AI #ML #NLP
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31👎1👌1
🤩 نقشه راه برای تبدیل شدن به دانشمند داده

⚫️تبدیل شدن به دانشمند داده نیازمند یادگیری مجموعه‌ای از مهارت‌های متنوع است.

⬅️ این مسیر شامل آموزش در زمینه‌هایی مانند ریاضیات و آمار، برنامه‌نویسی (عمدتاً پایتون و R)، تجزیه و تحلیل داده‌ها، یادگیری ماشین، و مصورسازی داده‌ها است. همچنین آشنایی با ابزارهای مختلفی مانند SQL، Hadoop، Spark، و TensorFlow از اهمیت بالایی برخوردار است.

⬅️این نقشه راه به شما نشان می‌دهد که چگونه می‌توانید از صفر تا تبدیل شدن به یک دانشمند داده حرفه‌ای پیش بروید.

#علم_داده #DataScience #پایتون #Python #یادگیری_ماشین #ماشین_لرنینگ #MachineLearning #ML
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👎1🔥1🦄1
0️⃣2️⃣ تابع پرکاربرد Pandas

✍️ اولین باری که از Pandas استفاده کردم، قرار بود با کمک توابع Pandas یک دیتاست خام و پیچیده را سریعاً تمیز و سازماندهی کنم. با استفاده از تابع groupby توانستم داده‌ها را دسته‌بندی کنم و تجزیه و تحلیل عمیقی از رفتار مشتریان به دست آورم. بهترین قسمت زمانی بود که از loc و iloc استفاده کردم و توانستم داده‌ها را به راحتی فیلتر کنم.

😄 از آن زمان تصمیم گرفتم فهرستی از پرکاربردترین توابع Pandas که به صورت روزانه از آن‌ها استفاده می‌کنم تهیه کنم. حالا این فهرست آماده است! در ادامه، 20 تا از بهترین و پرکاربردترین توابع Pandas را معرفی می‌کنم:


🖥 read_csv():
بارگذاری سریع داده‌ها از فایل‌های CSV

🖥 head():
مشاهده پنج ردیف اول دیتابیس برای شروع.

🖥 info():
بررسی ساختار داده‌ها مانند نوع داده و مقادیر خالی.

🖥 describe():
تولید آمار توصیفی برای ستون‌های عددی.

🖥 loc[ ]:
دسترسی به ردیف‌ها و ستون‌ها بر اساس برچسب یا شرط.

🖥 iloc[ ]:
دسترسی به داده‌ها بر اساس شماره ردیف.

🖥 merge():
ادغام DataFrame‌ها با ستون‌های مشترک.

🖥 groupby():
دسته‌بندی برای تحلیل آسان‌تر.

🖥 pivot_table():
خلاصه‌سازی داده‌ها به فرمت Pivot Table.

🖥 to_csv():
ذخیره داده‌ها به صورت فایل CSV.

🖥 pd.concat():
ادغام چندین DataFrame در ردیف‌ها یا ستون‌ها.

🖥 pd.melt():
تبدیل داده‌ها از فرمت گسترده به فرمت طولانی.

🖥 pd.pivot_table():
ایجاد Pivot Table با چندین سطح.

🖥 pd.cut():
تقسیم داده‌ها به فواصل مشخص.

🖥 pd.qcut():
مرتب‌سازی داده‌ها بر اساس درصد.

🖥 pd.merge():
ادغام داده‌ها به سبک پایگاه داده برای لینک‌دهی پیشرفته.

🖥 DataFrame.apply():
اعمال یک تابع سفارشی به داده‌ها.

🖥 DataFrame.groupby():
تحلیل داده‌های دسته‌بندی شده.

🖥 DataFrame.drop_duplicates():
حذف ردیف‌های تکراری.

🖥 DataFrame.to_excel():
ذخیره داده‌ها مستقیماً به فایل اکسل.


🐼 Pandas Functions
📄 PDF


#برنامه_نویسی #پایتون #Python #Programming #Pandas #Datascience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍1👎1
import_data.pdf
135.2 KB
🔰 Python For Data Science Cheat Sheet
🎥Importing Data
Please open Telegram to view this post
VIEW IN TELEGRAM
jupyter.pdf
785.4 KB
🔰 Python For Data Science Cheat Sheet
🎥Jupyter Notebook
Please open Telegram to view this post
VIEW IN TELEGRAM
numpy_basics.pdf
649.4 KB
🔰 Python For Data Science Cheat Sheet
🎥NumPy Basics
Please open Telegram to view this post
VIEW IN TELEGRAM
pandas.pdf
185.9 KB
🔰 Python For Data Science Cheat Sheet
🎥Pandas
Please open Telegram to view this post
VIEW IN TELEGRAM
pandas_basics.pdf
683.5 KB
🔰 Python For Data Science Cheat Sheet
🎥Pandas Basics
Please open Telegram to view this post
VIEW IN TELEGRAM
python_basics.pdf
212.3 KB
🔰 Python For Data Science Cheat Sheet
🎥Python Basics

#برنامه_نویسی #پایتون #Python #ML #NLP #Programming #Pandas #DataScience #Cheat_Sheet #Data_Science #Jupyter #NumPy
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
‏✦ LeetCode مخصوص دیتا ساینس رو پیدا کردم!

DataLemur یه پلتفرم قدرتمنده که توش سوالات واقعی مصاحبه‌های کاری شرکت‌هایی مثل Tesla، Facebook، Twitter، Microsoft و کلی شرکت معروف دیگه جمع‌آوری شده.
داخلش تمرین‌های کاربردی تو حوزه‌های SQL، آمار، پایتون و یادگیری ماشین هست و میتونی بر اساس سطح سختی یا نام شرکت فیلترشون کنی.

اگه داری برای مصاحبه شغل‌های Data Scientist یا Data Analyst آماده می‌شی، این سایت واقعا تکه!

#علم_داده #DataScience #یادگیری_ماشین #SQL #MACHINE_LEARNING
#پایتون #Python #ML #NLP
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
یه ابزار خیلی خفن برای کسایی که با دیتابیس کار میکنن: drawDB

این سایت یه ادیتور آنلاین قدرتمنده که میتونی بصورت بصری دیاگرام‌های پایگاه داده رو بسازی و به شکل خودکار کد SQL تولید کنی.

🔗: https://github.com/drawdb-io/drawdb

#DataScience #Database #SQL
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍42
💡 ۱۰ تا از مهم‌ترین ساختار داده‌هایی که هر روز ازشون استفاده میکنیم

‏⦿ List (لیست): نگه داشتن فیدهای توییتر یا هر جریان داده‌ی پشت‌سرهم.

‏⦿ Stack (پشته): امکان Undo/Redo توی ادیتورهای متن.

‏⦿ Queue (صف): مدیریت کارهای پرینتر یا ارسال اکشن‌های کاربر داخل بازی.

‏⦿ Hash Table (هش‌تیبل): سیستم‌های کشینگ برای دسترسی سریع‌تر به داده.

‏⦿ Array (آرایه): انجام عملیات ریاضی و پردازش‌هایی که سرعت بالا می‌خوان.

‏⦿ Heap (هیپ): زمان‌بندی تسک‌ها و مدیریت اولویت‌ها.

‏⦿ Tree (درخت): نگه‌داری ساختار HTML یا تصمیم‌گیری توی مدل‌های هوش مصنوعی.

‏⦿ Suffix Tree (درخت پسوندی): جستجوی فوق‌سریع رشته‌ها داخل یک متن.

‏⦿ Graph (گراف): دنبال کردن روابط مثل دوستی‌ها، یا پیدا کردن سریع‌ترین مسیر.

‏⦿ R-Tree (آر-تری): پیدا کردن نزدیک‌ترین همسایه در داده‌های مکانی.

‏⦿ Vertex Buffer (ورتکس بافر): ارسال داده‌های هندسی به GPU برای رندر گرفتن.

#DataStructure #DataScience #Data
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
4👍4