هوش مصنوعی و علم داده به فارسی
6.08K subscribers
974 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🧠🔍 آشنایی با اصطلاحات مهم در مدل‌های زبانی بزرگ (LLM)

این تصویر، اصطلاحات کلیدی مرتبط با مدل‌های زبانی بزرگ را معرفی می‌کند.

مدل پایه (Foundation Model):
طراحی شده برای تولید و فهم متن‌های انسانی.

ترانسفورمر (Transformer): شناخته شده به خاطر مکانیزم توجه.

پرامپتینگ (Prompting): ارائه ورودی‌های دقیق به LLM برای تولید خروجی.

طول کانتکست (Context-Length): حداکثر تعداد کلمات قابل پردازش.

آموزش چند-مثاله (Few-Shot Learning): ارائه تعداد کم مثال برای انجام وظیفه.

آموزش بدون مثال (Zero-Shot Learning): ارائه دستورالعمل‌های وظیفه بدون مثال.

رگ RAG (تولید تقویت شده با بازیابی): استفاده از اطلاعات بازیابی شده برای بهبود پاسخ‌ها.

تنظیم دقیق (Fine-Tuning): تطبیق LLM به وظیفه خاص با آموزش بیشتر.

توهم (Hallucination): تمایل به تولید اطلاعات نادرست.

#مدل_زبانی #LLM #اصطلاحات



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍86🔥1🙏1
@DataPlusScience__Introduction to RAG.pdf
560.6 KB
📑 مقدمه‌ای بر RAG و کاربردهای آن

💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) می‌پردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدل‌های LLM (Large Language Models) توضیح می‌دهد.

📄 ساختار کلی:

محدودیت‌های LLM: چالش‌های مدل‌های زبان بزرگ، مانند توهمات (Hallucinations) و عدم به‌روزرسانی به‌موقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطاف‌پذیری، و امکان استفاده از داده‌های خارجی.
کاربردها: چت‌بات‌ها (Chatbots)، پاسخ‌دهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.


📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
🔥1
@DataPlusScience - GenAI Concepts.pdf
2.4 MB
📊 مفاهیم اساسی هوش مصنوعی مولد (GenAI Concepts)

💡 این فایل شامل توضیحاتی از جمله مدل‌های بزرگ زبان (LLMs)، مهندسی پرامپت، معماری Transformer، یادگیری تقویتی از بازخورد انسانی (RLHF)، و مسائل مربوط به حفظ حریم خصوصی است.

📄 محتویات داکیومنت:

مفاهیم فنی: توضیحاتی درباره مدل‌های بزرگ زبان (LLMs)، پرامپت و مهندسی پرامپت، معماری Transformer و یادگیری انتقالی.
مباحث عملیاتی: شامل توسعه، توزیع، و استقرار مدل‌ها و استفاده از کتابخانه‌های هوش مصنوعی.
نکات نظارتی: مسائل مرتبط با حریم خصوصی، امنیت داده، شفافیت، و استانداردهای هوش مصنوعی.

📢 #هوش_مصنوعی #هوش_مصنوعی_مولد #GenAI #حریم_خصوصی #LLM #MachineLearning #DataPrivacy


برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
👍51
🤖 LLMها در پیش‌بینی اکتشافات علمی ناتوانند

‏تحقیقات جدیدی از دانشگاه آکسفورد، استنفورد و موسسه آلن نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) فعلی در پیش‌بینی اکتشافات علمی آینده عملکرد ضعیفی دارند. این مدل‌ها که بر اساس داده‌های موجود آموزش دیده‌اند، در پاسخ به سوالات درباره رویدادهای آینده، اغلب با اتکا به دانش گذشته، پاسخ‌های نادرستی ارائه می‌دهند.

⚡️ برای ارزیابی دقیق‌تر، بنچمارک CUSP (مخفف عبارت انگلیسی) طراحی شده است که مدل‌ها را مجبور می‌کند تا بر اساس اطلاعات موجود تا یک تاریخ مشخص، آینده را پیش‌بینی کنند. در این بنچمارک، مدل‌هایی مانند GPT-4.5 و Claude Sonnet 4.5 در انتخاب جهت‌گیری‌های فنی احتمالی عملکرد نسبتاً خوبی داشتند (حدود ۸۲٪ دقت)، اما در پیش‌بینی وقوع یا عدم وقوع یک دستاورد خاص، دقت آن‌ها به حد شانس (۴۵-۵۲٪) کاهش یافت.

🟡 Arxiv
📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
Parallax: نوآوری در مکانیسم توجه ترنسفورمر

💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بوده‌اند.
🔄 یک مقاله جدید، Parallax را معرفی می‌کند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیری‌شده به آن می‌افزاید.
🔬 تیمی از محققان از دانشگاه‌های Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتری‌شده) توسعه داده‌اند که برای پیش‌آموزش LLMها (مدل‌های زبان بزرگ) مقیاس‌پذیر است و با Muon هم‌طراحی شده است.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
🤖 استارتاپ‌های آمریکایی به سمت مدل‌های زبانی چینی حرکت می‌کنند

‏استارتاپ‌های هوش مصنوعی در آمریکا به طور فزاینده‌ای ترافیک اپلیکیشن‌های خود را به سمت مدل‌های زبانی بزرگ (LLMs) چینی هدایت می‌کنند. این تغییر نشان‌دهنده کاهش وابستگی به برندهای خاص و تمرکز بیشتر بر کارایی و توانایی مدل‌ها است.


🔹 روند بازار: در حالی که مدل‌های آمریکایی تا اوایل سال ۲۰۲۶ در مصرف توکن پیشتاز بودند، مدل‌های چینی از آن زمان به بعد محرک اصلی رشد در این بخش شده‌اند.
🔸 اولویت‌بندی: استارتاپ‌ها اکنون مدل‌ها را بر اساس قابلیت عملیاتی و نه صرفاً مبدأ آن‌ها انتخاب می‌کنند.


🔗 OpenRouter

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #LLM