• AI & Python •
21.1K subscribers
1.05K photos
386 videos
63 files
582 links
••• علاقه‌مند به دنیای هوش مصنوعی، تحول دیجیتال و زبان برنامه‌نویسی پایتون با نیم نگاهی به حوزه شبکه و
امنیت.

Library & archive: @SecBookSs



.
Download Telegram
Tang T. 60 ChatGPT Prompts for Data Science 2023.pdf
9.8 MB
کتاب 60 پرامپت برای مدل های زبانی بزرگ برای دیتاساینس ( علم داده )

#هوش_مصنوعی #AI #علم_داده #datascience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍41🔥1
30 Python libraries .pdf
9.3 MB
30 کتابخانه پایتون برای تقویت مهارت های شما در علم داده

نویسنده: Avi Chawla

#علم_داده #datascience #برنامه_نویسی #Python #Programming
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍4
💢 32 مجموعه داده ضروری برای پروژه‌های علم داده

وب سایت Data Science Dojo مجموعه ای از 32 مجموعه داده با سطوح دشواری مختلف برای تمرین و بهبود مهارت های شما به عنوان یک دانشمند داده ایجاد کرده است.

• این مجموعه شامل طیف متنوعی از موضوعات است که با توجه به سطح دشواری طبقه‌بندی شده است تا برای همه مناسب باشد و دانش نظری و تجربیات عملی شما را در بخش‌های مختلف علم داده مانند پاکسازی داده ها، تجسم داده ها، یادگیری ماشینی به چالش بکشد.

🟢 سطح پایه
🏷 Datasets
Abalone
User Knowledge Modeling
Real Estate Valuation
Wireless Indoor Localization
Car Evaluation
Fertility
Qualitative Bankruptcy


🟡 سطح متوسط
🏷 Datasets
Auto MPG
Heart Disease
Daily Demand Forecasting Orders
Blood Transfusion Service Center
Beijing PM2.5
Echocardiogram
Concrete Compressive Strength
Liver Disorders
Dow Jones Index
Energy Efficiency
Glass Identification
Hepatitis
Wholesale Customers
Travel Reviews
Istanbul Stock Exchange
Bike Sharing
Occupancy Detection
Census Income
Coronavirus


🔴 سطح پیشرفته
🏷 Generative AI for Beginners
Autism Screening Adult
Default of Credit Card Clients
Banknote Authentication
Individual Household Electric Power
Online News Popularity
Amazon Product Reviews


#علم_داده #Datascience    
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍3👏1
Python Data Science Projects @AIPyth0n.PDF
2.1 MB
👩‍💻 پروژه‌های علوم داده با پایتون
» برای تقویت نمونه کارها


#برنامه_نویسی #Python #Programming #DataScience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31👏1
This media is not supported in your browser
VIEW IN TELEGRAM
⬅️ نقشه راه یادگیری علم داده

⏯️ ریاضیات: تاکید بر جبر خطی، محاسبه و مفاهیم آماری.

2️⃣ برنامه‌نویسی: استفاده از پایتون و آر، مدیریت پایگاه‌های داده و استفاده از گیت.

3️⃣ احتمالات: درک توزیع‌ها و متغیرهای تصادفی.

4️⃣ آمار: یادگیری در مورد نمونه‌برداری داده، آزمون فرض و ANOVA.

5️⃣ بصری‌سازی داده: استفاده از ابزارهایی مانند Qlik Sense برای ایجاد بینش‌های بصری.

6️⃣ یادگیری ماشین: پیشرفت از مبانی تا مفاهیم پیشرفته مانند مدیریت نشت داده.

7️⃣ مهندسی ویژگی: بهبود مدل‌ها با انتخاب و کدگذاری ویژگی‌ها.

8️⃣ پردازش زبان طبیعی: تحلیل متن از طریق طبقه‌بندی و بردارها.

9️⃣ یادگیری عمیق: ساخت مدل‌های پیچیده با TensorFlow و PyTorch.

0️⃣⏯️ راه‌اندازی: استفاده از پلتفرم‌هایی مانند Azure و ابزارهایی مانند Flask.

#DataScience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍2🤯2
✏️ فهرست بزرگی از منابع برای تمرین علم داده

• مجموعه‌ای از کتابخانه‌های پایتون، لینک آموزش ها، لینک نمونه کدها برای حل مشکلات DS.

👨‍💻 https://github.com/r0f1/datascience

#علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2👏1
matt-harrison-effective-pandas-patterns-for-data-2021.pdf
38.1 MB
📕 Effective Pandas

🔖 کتابخونه pandas یکی از مهم‌ترین و اصلی‌ترین کتابخونه‌های پیش‌پردازش داده‌ها و کار با Data Frame هاست. مسلط شدن به pandas برای کسانی که در حوزه دیتا کار می‌کنن، یک نیاز واجب و ضروریه.

نویسنده این کتاب، آقای مت هریسون، در این اثر ارزشمند به تفصیل pandas رو توضیح میده و نکته مبهم و سخن نگفته‌ای رو باقی نمی‌ذاره.

مطالعه این کتاب فوق‌العاده از این نویسنده بسیار توانمند رو به کسانی که قصد تسلط و درک عمیق pandas رو دارن، بسیار پیشنهاد می‌کنیم.

#علم_داده #Pandas #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🗿2
🖥 توی این ریپو یه مجموعه غنی و کامل از سوالاتی که موقع مصاحبه برای موقعیت شغلی Data Scientist مطرح شده به همراه جوابشون، جمع‌آوری شده.

و از زوایای زیر هم دسته بندی شدن:

🔢 یادگیری ماشین و یادگیری عمیق که موضوعاتی از قبیل جنگل‌های تصادفی، رگراسیون خطی، Loss Function , Cost Function, SVM , Active Learning و ...

🔢 آمار و احتمال شامل سوالاتی درباره آزمون فرض، قضیه حد مرکزی و توزیع داده‌ها و ...

🔢 پایتون با مشکلات و چالش‌های مرتبط با داده‌ها با استفاده از کتابخانه‌هایی مانند Pandas معروف و ...

🔢 پایگاه داده و SQL با سوالات متمرکز بر بازیابی داده و تجزیه و تحلیل داده.

🔢 سوالات مبتنی بر رزومه

💡در کل اگر برای مصاحبه با موقعیت Data Scientist آماده می‌شید، این مخزن می‌تونه منبع مفیدی باشه تا با سوالات رایج معمول و مهارت‌های حل مسئله خود آشنا بشید.

🧑‍💻 GitHub Link

#DataScience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🤯2👏1
🔖 دستورات مهم Pandas و Spark برای علم‌داده

#علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2👏1
25 معادله ریاضی پرکاربرد در علم داده

#علم_داده #DataScience #دیتا_ساینس
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍42👏1
📝 برگه تقلب Numpy برای علم داده

#علم_داده #DataScience #Numpy #Python #پایتون
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5👎1🔥1
📱 کتابخانه‌های پایتون برای علم داده

پایتون یکی از زبان‌های برنامه‌نویسی محبوب در حوزه علم داده است و دلیل این محبوبیت، وجود کتابخانه‌های قدرتمند و متنوع برای انجام تحلیل داده‌ها، مدلسازی آماری، یادگیری ماشین و بصری‌سازی داده‌ها است.
برخی از مهم‌ترین این کتابخانه‌ها عبارتند از:

1️⃣ NumPy: برای کار با آرایه‌های چندبعدی و انجام عملیات ریاضی پیچیده.

2️⃣ Pandas: برای دستکاری و تحلیل داده‌ها در قالب داده‌سازها.

3️⃣ Matplotlib و Seaborn: برای رسم نمودارها و بصری‌سازی داده‌ها.

4️⃣ Scikit-Learn: برای انجام یادگیری ماشین و مدل‌های پیش‌بینی.

5️⃣ TensorFlow و Keras: برای ساخت و آموزش مدل‌های شبکه‌های عصبی.

6️⃣ SciPy: برای انجام محاسبات علمی و فنی پیشرفته در علم داده استفاده می‌شود.

⬅️ این کتابخانه‌ها ابزارهای قدرتمندی هستند که به متخصصین علم داده کمک می‌کنند تا داده‌ها را به شکل بهینه‌تر تحلیل و مدل‌سازی کنند.

#برنامه_نویسی #پایتون #Python #Programming #علم_داده #DataScience
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2👎1👏1🙏1🦄1
📱 پایتون زبان اول GitHub شد!

✔️ در گزارشی اخیرا در GitHub، با گسترش هوش مصنوعی، پایتون سرانجام می‌تواند جاوااسکریپت را پشت سر بگذارد و محبوب‌ترین زبان در GitHub در سال 2024 شود. این اتفاق پس از 10 سال تسلط جاوااسکریپت رخ داده و عجیب نیست.

🧠 زیرا با رشد هوش مصنوعی، توسعه‌دهندگان بیش از هر زمان دیگری به پایتون روی می‌آورند و کاربردهای پایتون در علوم داده و تحلیل‌ها هر روز در حال افزایش است. می‌توانید گزارش کامل GitHub را اینجا بخوانید:
🐱 Top programming along GitHub
💰 Report

مهم‌ترین کتابخانه‌های پایتون برای کار با داده و هوش مصنوعی را اینجا معرفی کرده‌ام: 👇

🖥 دستکاری و تحلیل داده
▶️ pandas
▶️ Apache Spark
▶️ Polars
▶️ DuckDB

📊 مصورسازی داده
➡️ matplotlib
➡️ plotly
➡️ seaborn

🖥 یادگیری ماشین و یادگیری عمیق
➡️ TensorFlow
➡️ PyTorch
➡️ Keras
➡️ scikit-learn
➡️ XGBoost
➡️ LightGBM
➡️ Prophet

🌫 پردازش زبان طبیعی و مدل‌های زبانی بزرگ
➡️ Hugging Face Transformers
➡️ LangChain
➡️ LlamaIndex

#برنامه_نویسی #پایتون #Python #هوش_مصنوعی #یادگیری_ماشین #یادگیری_عمیق #علم_داده #جاوااسکریپت #DataScience #Programming #AI #ML #NLP
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31👎1👌1
🤩 نقشه راه برای تبدیل شدن به دانشمند داده

⚫️تبدیل شدن به دانشمند داده نیازمند یادگیری مجموعه‌ای از مهارت‌های متنوع است.

⬅️ این مسیر شامل آموزش در زمینه‌هایی مانند ریاضیات و آمار، برنامه‌نویسی (عمدتاً پایتون و R)، تجزیه و تحلیل داده‌ها، یادگیری ماشین، و مصورسازی داده‌ها است. همچنین آشنایی با ابزارهای مختلفی مانند SQL، Hadoop، Spark، و TensorFlow از اهمیت بالایی برخوردار است.

⬅️این نقشه راه به شما نشان می‌دهد که چگونه می‌توانید از صفر تا تبدیل شدن به یک دانشمند داده حرفه‌ای پیش بروید.

#علم_داده #DataScience #پایتون #Python #یادگیری_ماشین #ماشین_لرنینگ #MachineLearning #ML
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👎1🔥1🦄1
0️⃣2️⃣ تابع پرکاربرد Pandas

✍️ اولین باری که از Pandas استفاده کردم، قرار بود با کمک توابع Pandas یک دیتاست خام و پیچیده را سریعاً تمیز و سازماندهی کنم. با استفاده از تابع groupby توانستم داده‌ها را دسته‌بندی کنم و تجزیه و تحلیل عمیقی از رفتار مشتریان به دست آورم. بهترین قسمت زمانی بود که از loc و iloc استفاده کردم و توانستم داده‌ها را به راحتی فیلتر کنم.

😄 از آن زمان تصمیم گرفتم فهرستی از پرکاربردترین توابع Pandas که به صورت روزانه از آن‌ها استفاده می‌کنم تهیه کنم. حالا این فهرست آماده است! در ادامه، 20 تا از بهترین و پرکاربردترین توابع Pandas را معرفی می‌کنم:


🖥 read_csv():
بارگذاری سریع داده‌ها از فایل‌های CSV

🖥 head():
مشاهده پنج ردیف اول دیتابیس برای شروع.

🖥 info():
بررسی ساختار داده‌ها مانند نوع داده و مقادیر خالی.

🖥 describe():
تولید آمار توصیفی برای ستون‌های عددی.

🖥 loc[ ]:
دسترسی به ردیف‌ها و ستون‌ها بر اساس برچسب یا شرط.

🖥 iloc[ ]:
دسترسی به داده‌ها بر اساس شماره ردیف.

🖥 merge():
ادغام DataFrame‌ها با ستون‌های مشترک.

🖥 groupby():
دسته‌بندی برای تحلیل آسان‌تر.

🖥 pivot_table():
خلاصه‌سازی داده‌ها به فرمت Pivot Table.

🖥 to_csv():
ذخیره داده‌ها به صورت فایل CSV.

🖥 pd.concat():
ادغام چندین DataFrame در ردیف‌ها یا ستون‌ها.

🖥 pd.melt():
تبدیل داده‌ها از فرمت گسترده به فرمت طولانی.

🖥 pd.pivot_table():
ایجاد Pivot Table با چندین سطح.

🖥 pd.cut():
تقسیم داده‌ها به فواصل مشخص.

🖥 pd.qcut():
مرتب‌سازی داده‌ها بر اساس درصد.

🖥 pd.merge():
ادغام داده‌ها به سبک پایگاه داده برای لینک‌دهی پیشرفته.

🖥 DataFrame.apply():
اعمال یک تابع سفارشی به داده‌ها.

🖥 DataFrame.groupby():
تحلیل داده‌های دسته‌بندی شده.

🖥 DataFrame.drop_duplicates():
حذف ردیف‌های تکراری.

🖥 DataFrame.to_excel():
ذخیره داده‌ها مستقیماً به فایل اکسل.


🐼 Pandas Functions
📄 PDF


#برنامه_نویسی #پایتون #Python #Programming #Pandas #Datascience #علم_داده
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍1👎1
import_data.pdf
135.2 KB
🔰 Python For Data Science Cheat Sheet
🎥Importing Data
Please open Telegram to view this post
VIEW IN TELEGRAM
jupyter.pdf
785.4 KB
🔰 Python For Data Science Cheat Sheet
🎥Jupyter Notebook
Please open Telegram to view this post
VIEW IN TELEGRAM
numpy_basics.pdf
649.4 KB
🔰 Python For Data Science Cheat Sheet
🎥NumPy Basics
Please open Telegram to view this post
VIEW IN TELEGRAM
pandas.pdf
185.9 KB
🔰 Python For Data Science Cheat Sheet
🎥Pandas
Please open Telegram to view this post
VIEW IN TELEGRAM
pandas_basics.pdf
683.5 KB
🔰 Python For Data Science Cheat Sheet
🎥Pandas Basics
Please open Telegram to view this post
VIEW IN TELEGRAM
python_basics.pdf
212.3 KB
🔰 Python For Data Science Cheat Sheet
🎥Python Basics

#برنامه_نویسی #پایتون #Python #ML #NLP #Programming #Pandas #DataScience #Cheat_Sheet #Data_Science #Jupyter #NumPy
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍42🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
‏✦ LeetCode مخصوص دیتا ساینس رو پیدا کردم!

DataLemur یه پلتفرم قدرتمنده که توش سوالات واقعی مصاحبه‌های کاری شرکت‌هایی مثل Tesla، Facebook، Twitter، Microsoft و کلی شرکت معروف دیگه جمع‌آوری شده.
داخلش تمرین‌های کاربردی تو حوزه‌های SQL، آمار، پایتون و یادگیری ماشین هست و میتونی بر اساس سطح سختی یا نام شرکت فیلترشون کنی.

اگه داری برای مصاحبه شغل‌های Data Scientist یا Data Analyst آماده می‌شی، این سایت واقعا تکه!

#علم_داده #DataScience #یادگیری_ماشین #SQL #MACHINE_LEARNING
#پایتون #Python #ML #NLP
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
یه ابزار خیلی خفن برای کسایی که با دیتابیس کار میکنن: drawDB

این سایت یه ادیتور آنلاین قدرتمنده که میتونی بصورت بصری دیاگرام‌های پایگاه داده رو بسازی و به شکل خودکار کد SQL تولید کنی.

🔗: https://github.com/drawdb-io/drawdb

#DataScience #Database #SQL
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
👍42
💡 ۱۰ تا از مهم‌ترین ساختار داده‌هایی که هر روز ازشون استفاده میکنیم

‏⦿ List (لیست): نگه داشتن فیدهای توییتر یا هر جریان داده‌ی پشت‌سرهم.

‏⦿ Stack (پشته): امکان Undo/Redo توی ادیتورهای متن.

‏⦿ Queue (صف): مدیریت کارهای پرینتر یا ارسال اکشن‌های کاربر داخل بازی.

‏⦿ Hash Table (هش‌تیبل): سیستم‌های کشینگ برای دسترسی سریع‌تر به داده.

‏⦿ Array (آرایه): انجام عملیات ریاضی و پردازش‌هایی که سرعت بالا می‌خوان.

‏⦿ Heap (هیپ): زمان‌بندی تسک‌ها و مدیریت اولویت‌ها.

‏⦿ Tree (درخت): نگه‌داری ساختار HTML یا تصمیم‌گیری توی مدل‌های هوش مصنوعی.

‏⦿ Suffix Tree (درخت پسوندی): جستجوی فوق‌سریع رشته‌ها داخل یک متن.

‏⦿ Graph (گراف): دنبال کردن روابط مثل دوستی‌ها، یا پیدا کردن سریع‌ترین مسیر.

‏⦿ R-Tree (آر-تری): پیدا کردن نزدیک‌ترین همسایه در داده‌های مکانی.

‏⦿ Vertex Buffer (ورتکس بافر): ارسال داده‌های هندسی به GPU برای رندر گرفتن.

#DataStructure #DataScience #Data
┏━━━━━━━━┓
@AIPyth0n
┗━━━━━━━━┛
4👍4