هوش مصنوعی و علم داده به فارسی
6.08K subscribers
976 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
Top 100 NLP questions @DataPlusScience.pdf
243 KB
Top 100 NLP questions

صد پرسش و پاسخ پیرامون متن‌کاوی و پردازش زبان طبیعی

@DataScience

#NLP
4👍2
اتمسفر #پایتون: ابزارهای تحلیل داده

این تصویر مجموعه‌ای از مهم‌ترین ابزارها و کتابخانه‌های پایتون را نشان می‌دهد که برای تحلیل داده، یادگیری ماشین، پردازش زبان طبیعی (NLP)، وب اسکرپینگ و... استفاده می‌شوند:

🛠 داده‌کاوی: Pandas، Vaex، NumPy

📊 پایگاه داده: Koalas، Dask

🤖 یادگیری ماشین: TensorFlow، PyTorch، Scikit-Learn، XGBoost

📈 بصری‌سازی: Matplotlib، Seaborn، Plotly

📅 سری‌های زمانی: Prophet، AutoTS

🗣 پردازش زبان طبیعی: spaCy، NLTK، BERT

📊 تحلیل آماری: SciPy، Statsmodels

🌐 وب اسکرپینگ: BeautifulSoup، Selenium، Scrapy


#Python #DataScience #MachineLearning #NLP #WebScraping #DataVisualization



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍62🔥1
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)

💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد.

📄 محتوای فایل:

استخراج متن از PDF با استفاده از PyMuPDF
تقسیم‌بندی متن به قطعات کوچکتر (Chunking)
روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبه‌بندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API

🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند.


📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
6👍2🔥1
@DataPlusScience___Guide to LLM.pdf
8 MB
📑 آموزش آسان مدل‌های بزرگ زبانی (Quick Guide to LLMs)

💡این فایل یک راهنمای کامل برای استفاده از مدل‌های بزرگ زبانی (LLMs)، مانند GPT و BERT، ارائه می‌دهد. با توضیح مباحثی از جمله مهندسی درخواست (Prompt Engineering) و تنظیمات تخصصی (Fine-Tuning)، این راهنما به شما کمک می‌کند تا از این مدل‌ها در برنامه‌های کاربردی خود به بهترین شکل بهره‌برداری کنید.

📄 ساختار فایل:

مقدمه‌ای بر LLMها: توضیح چیستی و کاربردهای مختلف
استراتژی‌های مهندسی درخواست: چگونگی بهینه‌سازی تعامل با مدل
تنظیمات تخصصی مدل‌ها: راه‌های بهبود عملکرد مدل‌ها برای وظایف خاص
پیاده‌سازی در ابر (Cloud Deployment): نکات کلیدی برای استقرار در فضای ابری


📢 #مدل_زبان_بزرگ #هوش_مصنوعی #مهندسی_درخواست #تنظیم_تخصصی #NLP #AI #CloudDeployment


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍6🔥2
@DataPlusScince __ Your First RAG.pdf
1.3 MB
📚 ساخت اولین سیستم RAG (Retrieval-Augmented Generation)

💡 این فایل آموزشی شامل مراحل ساخت یک سیستم RAG ساده برای پاسخگویی به سوالات بر اساس اسناد است. مفاهیم کلیدی مانند استخراج متن (Text Extraction)، تقسیم‌بندی متن (Text Chunking) و جستجوی برداری (Vector Search) را توضیح می‌دهد.

📄 محتوای فایل:

استخراج متن از PDF با استفاده از PyMuPDF
تقسیم‌بندی متن به قطعات کوچکتر (Chunking)
روش‌های بازیابی اطلاعات: جستجوی کلیدواژه‌ای (Keyword-based) و جستجوی برداری (Vector-based)
الگوریتم Okapi BM25 برای رتبه‌بندی اسناد
استفاده از Embeddings برای محاسبه شباهت معنایی
ساخت یک سیستم RAG ساده با استفاده از OpenAI API

🔬 این فایل همچنین محدودیت‌های سیستم RAG پایه را نشان می‌دهد و زمینه را برای بحث در مورد تکنیک‌های پیشرفته‌تر در فصل‌های بعدی فراهم می‌کند.


📢 #RAG #NLP #MachineLearning #VectorSearch #TextExtraction #پردازش_زبان_طبیعی #یادگیری_ماشین #هوش_مصنوعی


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍4🔥21
📚 مجموعه رایگان دوره‌های یادگیری ماشین و هوش مصنوعی

‏مخزن ML-Course-Notes مجموعه‌ای منسجم از یادداشت‌های دوره‌های یادگیری ماشین، پردازش زبان طبیعی (NLP) و هوش مصنوعی است که حول دوره‌های کامل و دانشگاهی سازمان‌دهی شده، نه صرفاً ویدیوهای تکی.

🧠 این مخزن شامل دوره‌هایی از Machine Learning Specialization، MIT 6.S191، CMU Neural Nets for NLP، CS224N و CS25 است. جدولی جامع از لکچرها، توضیحات، ویدیوها، یادداشت‌ها و نویسندگان در آن ارائه شده.

🗺 به جای جمع‌آوری صدها لینک پراکنده، نقشه‌ای دوره‌ای طراحی شده که یادگیرندگان بتوانند به‌صورت نظام‌مند مطالب را طی کنند و پس از چند روز مطالعه سردرگم نشوند.

🔗 لینک‌های اصلی لکچرها و یادداشت‌های همراه در مخزن موجود است. همچنین نشانه‌های WIP (کار در حال انجام) برای مواد ناتمام و دستورالعمل‌هایی برای مشارکت‌کنندگان جهت بهبود یادداشت‌ها قرار گرفته است.

🔗 ML-Course-Notes

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #NLP