هوش مصنوعی و علم داده به فارسی
6.08K subscribers
975 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 مایکروسافت هفت مدل هوش مصنوعی جدید منتشر کرد

‏مایکروسافت همزمان هفت مدل AI جدید را معرفی کرد. اما مهم‌ترین نکته این اعلامیه، خود مدل‌ها نیست بلکه جهت‌گیراتری استراتژیک است. شرکت قصد دارد از یک شریک OpenAI به یک آزمایشگاه مستقل frontier-تبدیل شود و این موضوع با یک گزارش فنی ۱۰۹ صفحه‌ای تحت عنوان Building a Hill-Climbing Machine همراه شده است.

🧠 در میان مدل‌ها، MAI-Thinking-1 برجسته‌ترین است: یک مدل reasoning (استدلال) با ۳۵ میلیارد پارامتر فعال که روی بنچمارک AIME 2025 امتیاز ۹۷٪ و روی SWE-Bench Pro امتیاز ۵۳٪ کسب کرده. همراه با آن یک مدل فشرده ۵ میلیاردی برای برنامه‌نویسی و مدل‌های تولید تصویر و صدا نیز منتشر شده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Microsoft
🤖 خودبهبودی مدل‌های هوش مصنوعی: گامی به سوی هوش مصنوعی پیشرفته

🚀 شرکت Anthropic مفهوم recursive self-improvement (خودبهبودی بازگشتی) را معرفی کرده است، جایی که مدل‌های هوش مصنوعی خود را بهبود می‌بخشند و آموزش می‌دهند. این پیشرفت‌ها به حدی سریع هستند که در آینده نزدیک، بخش عمده‌ای از کدنویسی و توسعه مدل‌های جدید توسط خود این مدل‌ها انجام خواهد شد، که این امر نیاز به بررسی و هماهنگی جهانی برای مدیریت توسعه مرزهای هوش مصنوعی را برجسته می‌کند.

💡 در حالی که انسان‌ها همچنان در تعیین اهداف بلندمدت و جهت‌دهی تحقیقاتی برتری دارند، مدل‌هایی مانند Claude بخش قابل توجهی از فرآیند توسعه را خودکار کرده‌اند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🎓 دوره آموزشی ترنسفورمرها و مدل‌های زبانی بزرگ

‏دوره CME295 از استنفورد با تمرکز بر Transformers (معماری پایه مدل‌های زبانی) و LLMs (مدل‌های زبانی بزرگ) در سال ۲۰۱۵ ارائه شده است.

🔗 پلی‌لیست یوتیوب دوره

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Transformers
Parallax: نوآوری در مکانیسم توجه ترنسفورمر

💡 مکانیسم توجه در ترنسفورمرها از سال ۲۰۱۷ تغییرات کمی داشته و بیشتر رویکردها بر جایگزینی کامل softmax (مکانیزم اصلی توجه) متمرکز بوده‌اند.
🔄 یک مقاله جدید، Parallax را معرفی می‌کند؛ رویکردی متفاوت که softmax را حفظ کرده و یک شاخه تصحیح یادگیری‌شده به آن می‌افزاید.
🔬 تیمی از محققان از دانشگاه‌های Northwestern و Washington و Tilde Research، Parallax را به عنوان یک Parameterized Local Linear Attention (مکانیسم توجه خطی محلی پارامتری‌شده) توسعه داده‌اند که برای پیش‌آموزش LLMها (مدل‌های زبان بزرگ) مقیاس‌پذیر است و با Muon هم‌طراحی شده است.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#پژوهش #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 فهم گام‌به‌گام LLMها

🔎 این راهنمای تعاملی سه بعدی به‌صورت تصویری، نحوهٔ کارکرد ترکیبات اصلی مدل‌های زبانی بزرگ را از Embedding تا Softmax به‌صورت مرحله‑به‑مرحله نشان می‌دهد و به‌جای مطالعهٔ مقالات، درک بصری را فراهم می‌کند.


🔹 Embedding: تبدیل توکن‌ها به فضای برداری ثابت
🔸 Layer Norm: نرمال‌سازی مقیاس‌دار برای پایداری آموزش
🔹 Self‑Attention: وزن‌دهی پویا بین همهٔ توکن‌ها
🔸 MLP: لایه‌های پیش‌ساز کامل (Fully‑Connected) برای پردازش غیرخطی
🔹 Transformer layers: ترکیب توجه و MLP در ساختار تودرتو
🔸 Softmax: تبدیل مقیاس نهایی به توزیع احتمال خروجی


📄 LLM Interactive Guide

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
1
🤖 پیشرفت سریع AI و نقش Anthropic

🚀 Anthropic Institute با گزارشی اعلام کرد که هوش مصنوعی به‌ویژه Claude (مدل زبانی) در حال پیشرفت‌های خودکار برای تولید کد است؛ در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافه‌شده به پایه‌کد شرکت توسط Claude نوشته شد.

📈 مهندسان در همان دوره حدود ۸ برابر بیشتر نسبت به ۲۰۲۴ کد می‌نویسند. توان حل مسأله بدون دخالت انسان هر چهار ماه تقریباً دوبرابر می‌شود؛ از چند دقیقه در Opus 3 (۲۰۲۴) تا ۱۲ ساعت در Opus 4.6 (۲۰۲۵).

🏥 پیش‌بینی می‌شود این سرعت رشد بهبودهای چشمگیری در پزشکی و علم ایجاد کند، اما نیاز به ابزارهای اعتبارسنجی و نظارت دارد.

🌐 Anthropic برای جلوگیری از تسریع بی‌قید و شرط، خواستار همکاری جهانی برای توانمندسازی مکانیسم‌های توقف موقت توسعه پیشرفته مدل‌هاست.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🚀 کتابخانه FlashLib برای یادگیری ماشین روی GPU

⚙️ FlashLib پیاده‌سازی‌های سریع kmeans, PCA و DBSCAN را با استفاده از Triton و CuteDSL روی GPU فراهم می‌کند و با API واضح، عملکرد عملیات را اندازه‌گیری می‌سازد.
📊 این کتابخانه 15 primitive سطح‑بالا را برای خوشه‌بندی، رگرسیون و تجزیه‑تحلیل پشتیبانی می‌کند و می‌تواند به‌راحتی با PyTorch و sklearn ادغام شود.

🔗 FlashLib GitHub repository

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🧠 PlanningBench: ارزیابی مهارت‌های برنامه‌ریزی LLMها

‏تنسنت هونیوان (Tencent Hunyuan) با همکاری دانشکده هوش مصنوعی گائولینگ در دانشگاه رنمین چین، فریم‌ورک جدیدی به نام PlanningBench را معرفی کرده‌اند. این ابزار جامع برای ارزیابی و آموزش مهارت‌های برنامه‌ریزی در مدل‌های زبان بزرگ (LLMها) طراحی شده است.

PlanningBench با هدف پر کردن شکاف‌های موجود در ارزیابی قابلیت‌های استدلال و برنامه‌ریزی LLMها، ویژگی‌های کلیدی زیر را ارائه می‌دهد:

🔹 بیش از ۳۰ وظیفه برنامه‌ریزی متنوع برگرفته از سناریوهای واقعی را شامل می‌شود.
🔸 قابلیت بررسی خودکار راه‌حل‌های ارائه شده توسط مدل‌ها را فراهم می‌کند.
🔺 از ارزیابی عملکرد مدل‌ها و همچنین آموزش آن‌ها برای بهبود مهارت‌های برنامه‌ریزی پشتیبانی می‌کند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
📊 صفحه پیشرو Arena برای ارزیابی عامل‌های هوش مصنوعی

‏Arena یک صفحه پیشرو واقعی برای عامل‌های هوش مصنوعی راه‌اندازی کرده است که فراتر از بنچمارک‌های سنتی، عملکرد مدل‌ها را بر اساس وظایف هدایت‌شده توسط کاربر ارزیابی می‌کند. این ارزیابی شامل فعالیت‌هایی مانند کدنویسی، ساخت اپلیکیشن، تحقیق، ایجاد مستندات و تحلیل فایل در جلسات زنده با استفاده از ابزارهای وب و ترمینال است. 🚀


🔹 معیارهای ارزیابی: موفقیت در وظیفه، پاسخگویی، بازیابی خطا، بازخورد کاربر و اجتناب از ابزارهای ناموجود.
🔸 مقیاس داده: این صفحه پیشرو شامل داده‌های بیش از ۳۰۰,۰۰۰ وظیفه و ۴۰ میلیون خط کد است.
🔹 رهبران فعلی: GPT-5.5 High در حال حاضر پیشتاز است، و پس از آن Claude Opus 4.7 Thinking و GPT-5.4 High قرار دارند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#گزارش #AgentAI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 اجرای مدل‌های LLM بر iOS با LM Studio

🚀 نرم‌افزار LM Studio نسخه موبایل (Locally) را برای iOS عرضه کرده و امکان اجرای مدل‌های کوچک مانند Gemma 4 E2B را مستقیماً روی آیفون و آیپد فراهم می‌کند. 📱 علاوه بر این، با قابلیت LM Link می‌توانید گوشی را به اینترنت متصل کرده و مدل‌های بزرگتر را روی کامپیوتر اجرا کنید و به‌صورت زنده از آن‌ها در دستگاه موبایل استفاده کنید.


🔹 امکان اجرا: مدل‌های کوچک به‌صورت بومی روی سخت‌افزار iOS کار می‌کنند.
🔸 اتصال به کامپیوتر: LM Link ارتباط اینترنتی میان گوشی و کامپیوتر را برقرار می‌سازد تا مدل‌های بزرگتر در دسترس باشند.
🔹 سازگاری: از iPhone و iPad پشتیبانی می‌شود، بدون نیاز به روت یا Jailbreak.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #44
از جمعه 1405/03/15 ساعت 14:00
تا شنبه 1405/03/16 ساعت 14:00
━━━━━━━━━━━━━━━

🤖 مدل‌های زبانی بزرگ و خودبهبودی

شرکت Anthropic مفهوم "خودبهبودی بازگشتی" (recursive self-improvement) را معرفی کرده است. در این رویکرد، مدل‌های هوش مصنوعی قادرند خودشان را بهبود بخشیده و آموزش دهند. پیشرفت‌ها در این زمینه به‌قدری سریع هستند که پیش‌بینی می‌شود در آینده نزدیک، بخش قابل توجهی از کدنویسی و توسعه نرم‌افزار توسط هوش مصنوعی انجام شود. همچنین، گزارش شده است که مدل Claude این شرکت در سال ۲۰۲۶ بیش از ۸۰٪ کدهای اضافه‌شده به پایه‌کد شرکت را تولید کرده است.
🔗 مشاهده پست
🔗 مشاهده پست


🔬 پژوهش و نوآوری در ترنسفورمرها

مقاله جدیدی با نام Parallax، رویکردی نوآورانه در مکانیسم توجه ترنسفورمرها (Transformer attention mechanism) ارائه می‌دهد. این رویکرد برخلاف تمرکز غالب بر جایگزینی کامل مکانیزم softmax، آن را حفظ کرده و یک "شاخه تصحیح" یادگیری‌شده به آن اضافه می‌کند. این نوآوری می‌تواند کارایی و دقت مدل‌های مبتنی بر ترنسفورمر را بهبود بخشد.
🔗 مشاهده پست


🎓 منابع آموزشی و درک بصری LLMها

یک راهنمای تعاملی سه‌بعدی به‌صورت تصویری، نحوه عملکرد ترکیبات اصلی مدل‌های زبانی بزرگ (LLMs) را از مرحله Embedding تا Softmax به‌صورت گام‌به‌گام نشان می‌دهد. این ابزار به جای مطالعه مقالات، درک بصری عمیقی از فرآیندهای داخلی LLMها فراهم می‌کند.
🔗 مشاهده پست


کتابخانه‌های کارآمد برای یادگیری ماشین روی GPU

کتابخانه FlashLib پیاده‌سازی‌های سریعی از الگوریتم‌های k-means, PCA و DBSCAN را با استفاده از Triton و CuteDSL بر روی GPU فراهم می‌کند. این کتابخانه با API واضح، امکان اندازه‌گیری عملیات را برای وظایف خوشه‌بندی، رگرسیون و تجزیه و تحلیل فراهم می‌سازد.
🔗 مشاهده پست


📊 ارزیابی پیشرفته عامل‌های هوش مصنوعی

صفحه پیشرو Arena برای ارزیابی عامل‌های هوش مصنوعی راه‌اندازی شده است. این پلتفرم فراتر از بنچمارک‌های سنتی، عملکرد مدل‌ها را بر اساس وظایف هدایت‌شده توسط کاربر، از جمله کدنویسی، ساخت اپلیکیشن، تحقیق و تولید محتوا، ارزیابی می‌کند.
🔗 مشاهده پست


🚀 اجرای LLMها روی دستگاه‌های موبایل

نرم‌افزار LM Studio نسخه موبایل خود را برای iOS عرضه کرده است که امکان اجرای مدل‌های کوچک مانند Gemma 4 E2B را مستقیماً بر روی آیفون و آیپد فراهم می‌کند. با قابلیت LM Link، می‌توان گوشی را به اینترنت متصل کرده و مدل‌های بزرگتر را روی کامپیوتر اجرا کرد.
🔗 مشاهده پست


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 فرآیند n8n: گام به گام
⚙️ این اینفوگرافی به معرفی فرآیند n8n (ابزار اتوماسیون گردش کار منبع‌باز) به صورت گام به گام می‌پردازد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 گراف دانش تعاملی از کدبیس

‏ابزاری جدید، هر کدبیس را به یک گراف دانش تعاملی تبدیل می‌کند تا درک و پیمایش آن آسان‌تر شود.
🔗 Understand-Anything

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #LangChain
🚀 گوگل مشتری جدید اسپیس‌ایکس شد

‏گوگل با اسپیس‌ایکس قراردادی برای اجاره ۱۱۰ هزار پردازنده گرافیکی (GPU) سری Blackwell منعقد کرده است. این قرارداد ماهانه ۹۲۰ میلیون دلار برای اسپیس‌ایکس به همراه خواهد داشت که معادل ۱۱.۶ دلار به ازای هر ساعت برای هر GPU است.

💡 این قرارداد در حالی منعقد می‌شود که اسپیس‌ایکس آماده عرضه اولیه عمومی (IPO) خود است و این درآمد اضافی می‌تواند به تقویت موقعیت مالی آن کمک کند.

💡 با احتساب قرارداد قبلی با Anthropic به ارزش ۱.۲۵ میلیارد دلار در ماه، درآمد اسپیس‌ایکس از اجاره مراکز داده به ۲۶ میلیارد دلار در سال می‌رسد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
🤖 مجموعه‌ای جامع از منابع یادگیری ماشین
‏این مخزن، مجموعه‌ای عظیم از منابع سازمان‌یافته در زمینه‌های یادگیری ماشین، یادگیری عمیق و هوش مصنوعی است که به جای جستجوهای بی‌پایان، دسترسی سریع به دسته‌بندی‌های مختلف را فراهم می‌کند. 📚
‏این مجموعه شامل بخش‌هایی چون مبانی یادگیری ماشین، شبکه‌های عصبی و معماری‌های مدرن، وظایف و حوزه‌های کاربردی، مجموعه داده‌ها، کتابخانه‌ها و ابزارها، انصاف و اخلاق در هوش مصنوعی، و تولید و عملیات یادگیری ماشین (MLOps) می‌شود. 📊
‏هر لینک دارای توضیحات کوتاهی است تا به سرعت بتوانید ارزش آن را تشخیص دهید و همچنین مجموعه‌هایی که بیش از یک سال به‌روزرسانی نشده‌اند، با آیکون مشخصی علامت‌گذاری شده‌اند. ⚠️

📖 Awesome Machine Learning Resources

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#معرفی #MLOps
🤖 دسترسی رایگان به ۷۰+ مدل زبانی انویدیا

🚀 انویدیا دسترسی API به بیش از ۷۰ مدل زبانی پیشرفته، شامل مدل‌هایی از Mistral، Gemma، DeepSeek، Kimi و Qwen را به‌صورت رایگان و بدون محدودیت‌های شدید ارائه کرده است. این فرصت استثنایی به توسعه‌دهندگان امکان می‌دهد تا به‌سرعت از این مدل‌ها در پروژه‌های خود بهره‌مند شوند.

📖 پلتفرم مدل‌های انویدیا

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
1
🚀 انویدیا RTX Spark: شتاب‌دهنده هوش مصنوعی برای ویندوز

‏Nvidia از RTX Spark Superchip رونمایی کرده است؛ سیستمی بر پایه تراشه که برای اجرای محلی مدل‌های هوش مصنوعی تا ۱۲۰ میلیارد پارامتر در ویندوز ۱۱ طراحی شده است. این تراشه از پردازنده مرکزی ۲۰ هسته‌ای Grace و هسته گرافیکی Blackwell با ۶۱۴۴ هسته CUDA بهره می‌برد و از طریق NVLink به هم متصل شده و تا ۱۲۸ گیگابایت حافظه یکپارچه LPDDR5X را پشتیبانی می‌کند. با توان حرارتی ۸۰ وات، قدرت پردازش گرافیکی آن با GeForce RTX 5070 موبایل قابل مقایسه است و از DLSS 4.5 پشتیبانی می‌کند. انتظار می‌رود لپ‌تاپ‌های مجهز به RTX Spark از پاییز امسال با قیمت پایه ۲۷۰۰ یورو عرضه شوند.


🔹 پردازش محلی: این تراشه امکان اجرای مدل‌های هوش مصنوعی بزرگ را مستقیماً روی دستگاه فراهم می‌کند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia