🧠🔍 آشنایی با اصطلاحات مهم در مدلهای زبانی بزرگ (LLM)
این تصویر، اصطلاحات کلیدی مرتبط با مدلهای زبانی بزرگ را معرفی میکند.
مدل پایه (Foundation Model): طراحی شده برای تولید و فهم متنهای انسانی.
ترانسفورمر (Transformer): شناخته شده به خاطر مکانیزم توجه.
پرامپتینگ (Prompting): ارائه ورودیهای دقیق به LLM برای تولید خروجی.
طول کانتکست (Context-Length): حداکثر تعداد کلمات قابل پردازش.
آموزش چند-مثاله (Few-Shot Learning): ارائه تعداد کم مثال برای انجام وظیفه.
آموزش بدون مثال (Zero-Shot Learning): ارائه دستورالعملهای وظیفه بدون مثال.
رگ RAG (تولید تقویت شده با بازیابی): استفاده از اطلاعات بازیابی شده برای بهبود پاسخها.
تنظیم دقیق (Fine-Tuning): تطبیق LLM به وظیفه خاص با آموزش بیشتر.
توهم (Hallucination): تمایل به تولید اطلاعات نادرست.
#مدل_زبانی #LLM #اصطلاحات
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
این تصویر، اصطلاحات کلیدی مرتبط با مدلهای زبانی بزرگ را معرفی میکند.
مدل پایه (Foundation Model): طراحی شده برای تولید و فهم متنهای انسانی.
ترانسفورمر (Transformer): شناخته شده به خاطر مکانیزم توجه.
پرامپتینگ (Prompting): ارائه ورودیهای دقیق به LLM برای تولید خروجی.
طول کانتکست (Context-Length): حداکثر تعداد کلمات قابل پردازش.
آموزش چند-مثاله (Few-Shot Learning): ارائه تعداد کم مثال برای انجام وظیفه.
آموزش بدون مثال (Zero-Shot Learning): ارائه دستورالعملهای وظیفه بدون مثال.
رگ RAG (تولید تقویت شده با بازیابی): استفاده از اطلاعات بازیابی شده برای بهبود پاسخها.
تنظیم دقیق (Fine-Tuning): تطبیق LLM به وظیفه خاص با آموزش بیشتر.
توهم (Hallucination): تمایل به تولید اطلاعات نادرست.
#مدل_زبانی #LLM #اصطلاحات
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
👍8❤6🔥1🙏1
@DataPlusScience__Introduction to RAG.pdf
560.6 KB
📑 مقدمهای بر RAG و کاربردهای آن
💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) میپردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدلهای LLM (Large Language Models) توضیح میدهد.
📄 ساختار کلی:
محدودیتهای LLM: چالشهای مدلهای زبان بزرگ، مانند توهمات (Hallucinations) و عدم بهروزرسانی بهموقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطافپذیری، و امکان استفاده از دادههای خارجی.
کاربردها: چتباتها (Chatbots)، پاسخدهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.
📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل به معرفی RAG (Retrieval-Augmented Generation) میپردازد و نحوه عملکرد، مزایا و کاربردهای آن را در بهبود کیفیت و دقت خروجی مدلهای LLM (Large Language Models) توضیح میدهد.
📄 ساختار کلی:
محدودیتهای LLM: چالشهای مدلهای زبان بزرگ، مانند توهمات (Hallucinations) و عدم بهروزرسانی بهموقع.
معماری RAG: ترکیب بازیابی اطلاعات با تولید متن.
مزایا: بهبود دقت، انعطافپذیری، و امکان استفاده از دادههای خارجی.
کاربردها: چتباتها (Chatbots)، پاسخدهی به سؤالات (Question Answering)، تولید محتوا (Content Generation) و کمک به حوزه سلامت.
📢 #علوم_داده #RAG #LLM #هوش_مصنوعی #یادگیری_ماشین
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
🔥1
@DataPlusScience - GenAI Concepts.pdf
2.4 MB
📊 مفاهیم اساسی هوش مصنوعی مولد (GenAI Concepts)
💡 این فایل شامل توضیحاتی از جمله مدلهای بزرگ زبان (LLMs)، مهندسی پرامپت، معماری Transformer، یادگیری تقویتی از بازخورد انسانی (RLHF)، و مسائل مربوط به حفظ حریم خصوصی است.
📄 محتویات داکیومنت:
مفاهیم فنی: توضیحاتی درباره مدلهای بزرگ زبان (LLMs)، پرامپت و مهندسی پرامپت، معماری Transformer و یادگیری انتقالی.
مباحث عملیاتی: شامل توسعه، توزیع، و استقرار مدلها و استفاده از کتابخانههای هوش مصنوعی.
نکات نظارتی: مسائل مرتبط با حریم خصوصی، امنیت داده، شفافیت، و استانداردهای هوش مصنوعی.
📢 #هوش_مصنوعی #هوش_مصنوعی_مولد #GenAI #حریم_خصوصی #LLM #MachineLearning #DataPrivacy
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
💡 این فایل شامل توضیحاتی از جمله مدلهای بزرگ زبان (LLMs)، مهندسی پرامپت، معماری Transformer، یادگیری تقویتی از بازخورد انسانی (RLHF)، و مسائل مربوط به حفظ حریم خصوصی است.
📄 محتویات داکیومنت:
مفاهیم فنی: توضیحاتی درباره مدلهای بزرگ زبان (LLMs)، پرامپت و مهندسی پرامپت، معماری Transformer و یادگیری انتقالی.
مباحث عملیاتی: شامل توسعه، توزیع، و استقرار مدلها و استفاده از کتابخانههای هوش مصنوعی.
نکات نظارتی: مسائل مرتبط با حریم خصوصی، امنیت داده، شفافیت، و استانداردهای هوش مصنوعی.
📢 #هوش_مصنوعی #هوش_مصنوعی_مولد #GenAI #حریم_خصوصی #LLM #MachineLearning #DataPrivacy
➖➖➖➖➖➖➖➖➖➖➖➖
برای آموزش علم داده به جمع ما بپیوندید: 👇
📊👨🏫 @DataPlusScience | @Data➕Science
👍5❤1
🤖 LLMها در پیشبینی اکتشافات علمی ناتوانند
تحقیقات جدیدی از دانشگاه آکسفورد، استنفورد و موسسه آلن نشان میدهد که مدلهای زبانی بزرگ (LLM) فعلی در پیشبینی اکتشافات علمی آینده عملکرد ضعیفی دارند. این مدلها که بر اساس دادههای موجود آموزش دیدهاند، در پاسخ به سوالات درباره رویدادهای آینده، اغلب با اتکا به دانش گذشته، پاسخهای نادرستی ارائه میدهند.
⚡️ برای ارزیابی دقیقتر، بنچمارک CUSP (مخفف عبارت انگلیسی) طراحی شده است که مدلها را مجبور میکند تا بر اساس اطلاعات موجود تا یک تاریخ مشخص، آینده را پیشبینی کنند. در این بنچمارک، مدلهایی مانند GPT-4.5 و Claude Sonnet 4.5 در انتخاب جهتگیریهای فنی احتمالی عملکرد نسبتاً خوبی داشتند (حدود ۸۲٪ دقت)، اما در پیشبینی وقوع یا عدم وقوع یک دستاورد خاص، دقت آنها به حد شانس (۴۵-۵۲٪) کاهش یافت.
🟡 Arxiv
#پژوهش #LLM
تحقیقات جدیدی از دانشگاه آکسفورد، استنفورد و موسسه آلن نشان میدهد که مدلهای زبانی بزرگ (LLM) فعلی در پیشبینی اکتشافات علمی آینده عملکرد ضعیفی دارند. این مدلها که بر اساس دادههای موجود آموزش دیدهاند، در پاسخ به سوالات درباره رویدادهای آینده، اغلب با اتکا به دانش گذشته، پاسخهای نادرستی ارائه میدهند.
⚡️ برای ارزیابی دقیقتر، بنچمارک CUSP (مخفف عبارت انگلیسی) طراحی شده است که مدلها را مجبور میکند تا بر اساس اطلاعات موجود تا یک تاریخ مشخص، آینده را پیشبینی کنند. در این بنچمارک، مدلهایی مانند GPT-4.5 و Claude Sonnet 4.5 در انتخاب جهتگیریهای فنی احتمالی عملکرد نسبتاً خوبی داشتند (حدود ۸۲٪ دقت)، اما در پیشبینی وقوع یا عدم وقوع یک دستاورد خاص، دقت آنها به حد شانس (۴۵-۵۲٪) کاهش یافت.
🟡 Arxiv
📊 Data➕Science — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#پژوهش #LLM
✨ Parallax: نوآوری در مکانیسم توجه ترنسفورمر
💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بودهاند.
🔄 یک مقاله جدید، Parallax را معرفی میکند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیریشده به آن میافزاید.
🔬 تیمی از محققان از دانشگاههای Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتریشده) توسعه دادهاند که برای پیشآموزش LLMها (مدلهای زبان بزرگ) مقیاسپذیر است و با Muon همطراحی شده است.
#پژوهش #LLM
💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بودهاند.
🔄 یک مقاله جدید، Parallax را معرفی میکند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیریشده به آن میافزاید.
🔬 تیمی از محققان از دانشگاههای Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتریشده) توسعه دادهاند که برای پیشآموزش LLMها (مدلهای زبان بزرگ) مقیاسپذیر است و با Muon همطراحی شده است.
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#پژوهش #LLM
🤖 استارتاپهای آمریکایی به سمت مدلهای زبانی چینی حرکت میکنند
استارتاپهای هوش مصنوعی در آمریکا به طور فزایندهای ترافیک اپلیکیشنهای خود را به سمت مدلهای زبانی بزرگ (LLMs) چینی هدایت میکنند. این تغییر نشاندهنده کاهش وابستگی به برندهای خاص و تمرکز بیشتر بر کارایی و توانایی مدلها است.
🔗 OpenRouter
#خبر #LLM
استارتاپهای هوش مصنوعی در آمریکا به طور فزایندهای ترافیک اپلیکیشنهای خود را به سمت مدلهای زبانی بزرگ (LLMs) چینی هدایت میکنند. این تغییر نشاندهنده کاهش وابستگی به برندهای خاص و تمرکز بیشتر بر کارایی و توانایی مدلها است.
🔹 روند بازار: در حالی که مدلهای آمریکایی تا اوایل سال ۲۰۲۶ در مصرف توکن پیشتاز بودند، مدلهای چینی از آن زمان به بعد محرک اصلی رشد در این بخش شدهاند.
🔸 اولویتبندی: استارتاپها اکنون مدلها را بر اساس قابلیت عملیاتی و نه صرفاً مبدأ آنها انتخاب میکنند.
🔗 OpenRouter
📊 Data➕Science 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
#خبر #LLM