هوش مصنوعی و علم داده به فارسی
6.08K subscribers
982 photos
266 videos
318 files
1.06K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #4
از دوشنبه 1405/03/11 ساعت 14:00
تا سه‌شنبه 1405/03/12 ساعت 14:00
━━━━━━━━━━━━━━━

💻 نوآوری و سخت‌افزار AI

* انویدیا و مایکروسافت با معرفی پلتفرم جدیدی برای کامپیوترهای شخصی (AI PCs)، عصر هوش مصنوعی را بازتعریف کردند. این پلتفرم بر پایه پردازنده‌های جدید RTX Spark Superchip (شامل واحد پردازش گرافیکی یا GPU، واحد پردازش مرکزی یا CPU و حافظه یکپارچه) بنا شده است که معماری مشابه تراشه‌های سری M اپل دارد. تراشه RTX Spark، یک تراشه ARM، برای رقابت در بازار لپ‌تاپ‌ها با سری M اپل طراحی شده و از حداکثر ۱۲۸ گیگابایت حافظه LPDDR5X با پهنای باند ۳۰۰ گیگابایت بر ثانیه از طریق NVLink C2C پشتیبانی می‌کند که امکان اجرای مدل‌های زبانی بزرگ (LLM - Large Language Models) را به صورت محلی فراهم می‌آورد.
🔗 لینک ۱، لینک ۲


🛠 ابزارها و پلتفرم‌های هوش مصنوعی

* یک سیستم چندعاملی (multi-agent system) برای خودکارسازی فرآیندهای تحقیقات عمیق و گزارش‌دهی توسعه یافته است. این سیستم، که از چندین عامل هوشمند برای انجام وظایف مختلف بهره می‌برد، قادر به انجام تحقیقات پیچیده و تولید گزارش‌های جامع به صورت خودکار است.
🔗 لینک
* پلتفرم متن‌باز Odysseus توسط یوتیوبر مشهور PewDiePie منتشر شده است. این ابزار به کاربران اجازه می‌دهد تا مدل‌های هوش مصنوعی و عوامل (agents - برنامه‌های هوشمندی که می‌توانند به صورت مستقل تصمیم‌گیری و عمل کنند) را به صورت محلی اجرا کنند و تجربه‌ای مشابه ChatGPT را با حفظ حریم خصوصی داده‌ها و بدون نیاز به اینترنت فراهم می‌آورد.
🔗 لینک


🎓 آموزش و منابع هوش مصنوعی

* مخزن عمومی AI_Books در گیت‌هاب، مجموعه‌ای جامع از کتاب‌ها و آموزش‌های حوزه‌های هوش مصنوعی، یادگیری ماشین (Machine Learning - ML)، یادگیری عمیق (Deep Learning - DL) و شبکه‌های عصبی را گردآوری کرده است که به سازماندهی مسیر مطالعاتی کمک می‌کند.
🔗 لینک
* تا ۱۶ خرداد، می‌توانید به تمام دوره‌های DataCamp به‌صورت کامل و رایگان دسترسی پیدا کنید و حتی گواهینامه دریافت کنید. این فرصتی عالی برای تقویت مهارت‌های داده‌محور است.
🔗 لینک
* DeepLearning.AI ابزاری کاربردی برای ارزیابی و توسعه مهارت‌های هوش مصنوعی ارائه کرده است. این ابزار به کاربران کمک می‌کند تا نقاط قوت خود را شناسایی کرده و مسیر یادگیری مناسبی را دنبال کنند.
🔗 لینک


📈 بازار و صنعت هوش مصنوعی

* گوگل با کمبود منابع برای توسعه هوش مصنوعی مواجه شده و اعلام کرده که تقاضا برای راهکارهای هوش مصنوعی‌اش از عرضه پیشی گرفته است. این کمبود، تخصیص منابع سخت‌افزاری مانند GPU (Graphics Processing Unit - واحد پردازش گرافیکی) و TPU (Tensor Processing Unit - واحد پردازش تانسور) را برای پروژه‌های داخلی نیز دشوار کرده است.
🔗 لینک


🌐 تاثیرات و کاربردهای هوش مصنوعی

* پژوهش اخیر نشان می‌دهد که ۸۵٪ معلمان و ۸۶٪ دانش‌آموزان در سال تحصیلی ۲۰۲۴-۲۵ از ابزارهای هوش مصنوعی استفاده کرده‌اند. معلمانی که حداقل یک بار در هفته از این ابزارها بهره می‌برند، به‌طور متوسط ۵.۹ ساعت در هفته زمان صرفه‌جویی می‌کنند که معادل شش هفته کامل کاری در طول سال تحصیلی است.
🔗 لینک


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🚀 DeepSeek: استقلال چین در هوش مصنوعی با چیپ‌های هواوی

‏بنیان‌گذار DeepSeek با موفقیت پایگاه کد این پروژه را از پردازنده‌های انویدیا به چیپ‌های Ascend هواوی منتقل کرده است. این اقدام جسورانه با هدف اثبات قابلیت‌های هوش مصنوعی چین بدون وابستگی به سخت‌افزار آمریکایی انجام شد.
💡 این انتقال که ماه‌ها به طول انجامید و منابع قابل توجهی را به خود اختصاص داد، بدون افت کیفیت مدل DeepSeek، نشان داد که چیپ‌های هواوی قادر به اجرای بارهای کاری سنگین هوش مصنوعی هستند.
🔗 این موفقیت، سایر شرکت‌های هوش مصنوعی چین را ترغیب می‌کند تا به سمت استفاده از سخت‌افزار بومی روی آورند و وابستگی به تامین‌کنندگان آمریکایی را کاهش دهند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#گزارش #Huawei
Media is too big
VIEW IN TELEGRAM
🚀 استراتژی‌های پیشرفته RAG برای ایجنت‌های هوش مصنوعی

‏این ویدیو به بررسی جامع مهم‌ترین استراتژی‌های Retrieval Augmented Generation (RAG) می‌پردازد که برای ساخت ایجنت‌های هوش مصنوعی دقیق‌تر و کارآمدتر ضروری هستند. از انتخاب رویکرد مناسب تا ترکیب روش‌های مختلف، این محتوا راهنمایی عملی ارائه می‌دهد.

💡 RAG (تولید تقویت‌شده با بازیابی اطلاعات) نقش محوری در بهبود عملکرد مدل‌های زبان بزرگ (LLM) ایفا می‌کند. با بازیابی اطلاعات مرتبط از منابع خارجی و استفاده از آن‌ها برای غنی‌سازی پاسخ‌های LLM، ایجنت‌های هوش مصنوعی می‌توانند با دقت و ارتباط بیشتری به پرسش‌ها پاسخ دهند و از پدیده "توهم" (hallucination) جلوگیری کنند.

زیرنویس فارسی روان و فنی: اختصاصی از @Algoticlab
🔗 نسخه اصلی در یوتیوب


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
The ultimate guide to fine tuning.pdf
15.2 MB
📚 کتاب جامع Fine-Tuning مدل‌های زبانی بزرگ

📖 این کتاب رایگان ۱۱۵ صفحه‌ای، راهنمایی کامل برای Fine-Tuning مدل‌های زبانی بزرگ (LLMs) است. این منبع به متخصصان کمک می‌کند تا فرآیندهای آماده‌سازی دیتاست، پیکربندی آموزش و بهبود کیفیت LLMها را برای وظایف خود درک کنند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #FineTuning
🤖 ابزار LLM Scraper: استخراج داده از وب با شبکه‌های عصبی

‏ابزار LLM Scraper با استفاده از مدل‌های زبانی بزرگ (LLM) امکان تبدیل صفحات وب به داده‌های ساختاریافته را فراهم می‌کند. این ابزار برای جمع‌آوری داده، نظارت بر وب‌سایت‌ها و آماده‌سازی مجموعه داده‌ها بدون نیاز به نوشتن پارسرهای پیچیده کاربرد دارد.
🔗 llm-scraper


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #LLMScraper
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سرویس Sites جدید OpenAI برای ساخت Nocode

🚀 سرویس جدید Sites از OpenAI با بهره‌گیری از Codex (مدل تولید کد) امکان ساخت وبسایت، لندینگ‌پیج و حتی داشبوردهای اداری را بدون نوشتن کد فراهم می‌کند و پس از طراحی به‌صورت خودکار deploy می‌شود.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #OpenAI
هوش مصنوعی و علم داده به فارسی
🤖 سرویس Sites جدید OpenAI برای ساخت Nocode ‏🚀 سرویس جدید Sites از OpenAI با بهره‌گیری از Codex (مدل تولید کد) امکان ساخت وبسایت، لندینگ‌پیج و حتی داشبوردهای اداری را بدون نوشتن کد فراهم می‌کند و پس از طراحی به‌صورت خودکار deploy می‌شود. 📊 DataScience 🇮🇷
🤖 سایت‌ساز OpenAI: از ایده تا اپلیکیشن در چند ثانیه

‏OpenAI با معرفی ویژگی Sites در ابزار کدنویسی Codex، امکان ساخت وب‌سایت، داشبورد، ابزار داخلی، اپلیکیشن تعاملی و حتی بازی را تنها با استفاده از پرامپت‌های متنی فراهم کرده است. این قابلیت که در حال حاضر برای کاربران Business و Enterprise به‌صورت پیش‌نمایش منتشر شده، فرآیند توسعه را به‌طور چشمگیری ساده می‌کند.

این سیستم به‌طور خودکار بخش‌های frontend، backend، پایگاه داده و حتی استقرار (deploy) روی Cloudflare را مدیریت می‌کند. کاربران دیگر نیازی به نگرانی در مورد هاستینگ، سرور یا مدیریت زیرساخت‌های پیچیده نخواهند داشت و بلافاصله یک URL عمومی دریافت می‌کنند که تیم می‌تواند برای همکاری و استفاده از اپلیکیشن آماده‌شده، از آن بهره ببرد. این ابزار قابلیت یکپارچه‌سازی با سرویس‌هایی مانند Figma و Snowflake را نیز دارد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🧠 درک عمیق‌تر پس‌انتشار در شبکه‌های عصبی

‏یادگیری نحوه محاسبه گرادیان‌ها و پس‌انتشار (backpropagation) در شبکه‌های عصبی، بدون فرمول‌های جعبه سیاه، با استفاده از یادداشت‌های دانشگاه استنفورد CS224N ممکن می‌شود. این یادداشت‌ها شکاف دانشی را که بسیاری با وجود استفاده روزمره از PyTorch یا TensorFlow دارند، پر می‌کنند.
📉 این یادداشت‌ها شامل مباحثی چون قاعده زنجیره‌ای (Chain Rule)، گراف‌های محاسباتی، مشتقات برداری و محاسبه کارآمد گرادیان با مثال‌های گام‌به‌گام و تحلیل فرمول‌ها هستند.

📖 یادداشت‌های محاسبه گرادیان شبکه‌های عصبی
🔗 PyTorch
🔗 TensorFlow

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Backpropagation
️ MAI-Transcribe-1.5: رونویسی گفتار فوق‌سریع مایکروسافت

🚀 مایکروسافت مدل MAI-Transcribe-1.5 را عرضه کرده، یک سیستم رونویسی گفتار (Speech Transcription) که صدا را ۲۷۶ برابر سریع‌تر از زمان واقعی پردازش می‌کند. این سرعت، آن را در صدر رقبا قرار می‌دهد.
📊 با نرخ خطای کلمه (WER) ۲.۴٪ در بنچمارک Artificial Analysis، این مدل جایگاه سوم را از نظر دقت کسب کرده و تنها از Alibaba Fun-Realtime-ASR-preview و ElevenLabs Scribe v2 ضعیف‌تر است.
🌍 MAI-Transcribe-1.5 از keyword biasing (اولویت‌دهی به کلمات خاص برای بهبود شناسایی اصطلاحات کمیاب مانند اسامی خاص یا واژگان پزشکی) و ۴۳ زبان، از جمله عربی، ژاپنی و چینی پشتیبانی می‌کند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Microsoft
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 مدل یکپارچه برای وظایف مختلف مکان‌یابی

‏مدل "Locate Anything" انویدیا، یک چارچوب یکپارچه مبتنی بر مدل‌های بینایی-زبان (vision-language models) است که طیف وسیعی از وظایف مکان‌یابی را پوشش می‌دهد. این وظایف شامل درک اسناد (document understanding)، مکان‌یابی عناصر رابط کاربری گرافیکی (GUI grounding)، تشخیص متراکم (dense detection) و تشخیص نوری کاراکتر (OCR) می‌شود.

🔗 Locate Anything Repo
📄 Diverse localization tasks under a unified vision-language model

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #ComputerVision
🤖 ۱۰ کاربرد برتر هوش مصنوعی مولد در ۲۰۲۶

🔍 بر اساس Harvard Business Review، رایج‌ترین مورد استفاده از هوش مصنوعی مولد در سال ۲۰۲۶، همچنان حوزهٔ درمان و همراهی عاطفی است؛ حتی اگر شرکت‌های AI ادعاهای متفاوتی داشته باشند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #GenAI
🤖 ساخت اسلایدهای PPT با هوش مصنوعی متن باز

📊 این ابزار متن باز با ۷ نقش تخصصی AI (مانند strategist و executor) به‌صورت هماهنگ اسلایدهای PowerPoint سطح مشاوران بزرگ را از هر PDF تولید می‌کند؛ شامل ۳۳ قالب نمودار، ۶۴۰ آیکون، و خروجی قابل ویرایش PPTX.
🚀 قابلیت یکپارچه‌سازی با Claude Code، Cursor یا VS Code و ارائه ۱۵ پروژه نمونه با ۲۲۹ اسلاید برای یادگیری عملی.

🔗 ppt‑master

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #Claude
Data Science Interview Questions.pdf
1.4 MB
💡 سوالات مصاحبه علم داده
‏مجموعه‌ای از سوالات مصاحبه علم داده برای آمادگی شغلی ارائه شده است. این مجموعه به داوطلبان کمک می‌کند تا مهارت‌های خود را در زمینه‌هایی مانند یادگیری ماشین، یادگیری عمیق، MLOps و مهندسی داده ارتقا دهند.



📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #DataScience
🇺🇸 آمریکا خواستار بررسی مدل‌های پیشرفته هوش مصنوعی قبل از انتشار شد

🇺🇸 دولت آمریکا با امضای یک دستور اجرایی، خواستار بررسی داوطلبانه مدل‌های مرزی (frontier models) قبل از انتشار عمومی شده است. این بررسی شامل سیستم‌هایی می‌شود که توانایی‌های سایبری پیشرفته‌ای مانند یافتن آسیب‌پذیری‌ها یا خودکارسازی عملیات سایبری را دارند. هدف اصلی، دادن فرصت به مدافعان سایبری برای آماده‌سازی پچ‌ها و پروتکل‌های امنیتی است.

🔒 طبق این چارچوب جدید، آزمایشگاه‌های هوش مصنوعی می‌توانند به مدت حداکثر ۳۰ روز دسترسی داوطلبانه به این مدل‌ها را به آژانس‌های فدرال بدهند. نهادهایی مانند NSA و CISA در ارزیابی این مدل‌ها مشارکت خواهند داشت و معیارهای مدل‌های مرزی از طریق فرآیند بنچمارکینگ (benchmarking) داخلی تعیین خواهد شد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #AgentAI