هوش مصنوعی و علم داده به فارسی
6.08K subscribers
976 photos
261 videos
316 files
1.04K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
The ultimate guide to fine tuning.pdf
15.2 MB
📚 کتاب جامع Fine-Tuning مدل‌های زبانی بزرگ

📖 این کتاب رایگان ۱۱۵ صفحه‌ای، راهنمایی کامل برای Fine-Tuning مدل‌های زبانی بزرگ (LLMs) است. این منبع به متخصصان کمک می‌کند تا فرآیندهای آماده‌سازی دیتاست، پیکربندی آموزش و بهبود کیفیت LLMها را برای وظایف خود درک کنند.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #FineTuning
🤖 ابزار LLM Scraper: استخراج داده از وب با شبکه‌های عصبی

‏ابزار LLM Scraper با استفاده از مدل‌های زبانی بزرگ (LLM) امکان تبدیل صفحات وب به داده‌های ساختاریافته را فراهم می‌کند. این ابزار برای جمع‌آوری داده، نظارت بر وب‌سایت‌ها و آماده‌سازی مجموعه داده‌ها بدون نیاز به نوشتن پارسرهای پیچیده کاربرد دارد.
🔗 llm-scraper


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #LLMScraper
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سرویس Sites جدید OpenAI برای ساخت Nocode

🚀 سرویس جدید Sites از OpenAI با بهره‌گیری از Codex (مدل تولید کد) امکان ساخت وبسایت، لندینگ‌پیج و حتی داشبوردهای اداری را بدون نوشتن کد فراهم می‌کند و پس از طراحی به‌صورت خودکار deploy می‌شود.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #OpenAI
هوش مصنوعی و علم داده به فارسی
🤖 سرویس Sites جدید OpenAI برای ساخت Nocode ‏🚀 سرویس جدید Sites از OpenAI با بهره‌گیری از Codex (مدل تولید کد) امکان ساخت وبسایت، لندینگ‌پیج و حتی داشبوردهای اداری را بدون نوشتن کد فراهم می‌کند و پس از طراحی به‌صورت خودکار deploy می‌شود. 📊 DataScience 🇮🇷
🤖 سایت‌ساز OpenAI: از ایده تا اپلیکیشن در چند ثانیه

‏OpenAI با معرفی ویژگی Sites در ابزار کدنویسی Codex، امکان ساخت وب‌سایت، داشبورد، ابزار داخلی، اپلیکیشن تعاملی و حتی بازی را تنها با استفاده از پرامپت‌های متنی فراهم کرده است. این قابلیت که در حال حاضر برای کاربران Business و Enterprise به‌صورت پیش‌نمایش منتشر شده، فرآیند توسعه را به‌طور چشمگیری ساده می‌کند.

این سیستم به‌طور خودکار بخش‌های frontend، backend، پایگاه داده و حتی استقرار (deploy) روی Cloudflare را مدیریت می‌کند. کاربران دیگر نیازی به نگرانی در مورد هاستینگ، سرور یا مدیریت زیرساخت‌های پیچیده نخواهند داشت و بلافاصله یک URL عمومی دریافت می‌کنند که تیم می‌تواند برای همکاری و استفاده از اپلیکیشن آماده‌شده، از آن بهره ببرد. این ابزار قابلیت یکپارچه‌سازی با سرویس‌هایی مانند Figma و Snowflake را نیز دارد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🧠 درک عمیق‌تر پس‌انتشار در شبکه‌های عصبی

‏یادگیری نحوه محاسبه گرادیان‌ها و پس‌انتشار (backpropagation) در شبکه‌های عصبی، بدون فرمول‌های جعبه سیاه، با استفاده از یادداشت‌های دانشگاه استنفورد CS224N ممکن می‌شود. این یادداشت‌ها شکاف دانشی را که بسیاری با وجود استفاده روزمره از PyTorch یا TensorFlow دارند، پر می‌کنند.
📉 این یادداشت‌ها شامل مباحثی چون قاعده زنجیره‌ای (Chain Rule)، گراف‌های محاسباتی، مشتقات برداری و محاسبه کارآمد گرادیان با مثال‌های گام‌به‌گام و تحلیل فرمول‌ها هستند.

📖 یادداشت‌های محاسبه گرادیان شبکه‌های عصبی
🔗 PyTorch
🔗 TensorFlow

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Backpropagation
️ MAI-Transcribe-1.5: رونویسی گفتار فوق‌سریع مایکروسافت

🚀 مایکروسافت مدل MAI-Transcribe-1.5 را عرضه کرده، یک سیستم رونویسی گفتار (Speech Transcription) که صدا را ۲۷۶ برابر سریع‌تر از زمان واقعی پردازش می‌کند. این سرعت، آن را در صدر رقبا قرار می‌دهد.
📊 با نرخ خطای کلمه (WER) ۲.۴٪ در بنچمارک Artificial Analysis، این مدل جایگاه سوم را از نظر دقت کسب کرده و تنها از Alibaba Fun-Realtime-ASR-preview و ElevenLabs Scribe v2 ضعیف‌تر است.
🌍 MAI-Transcribe-1.5 از keyword biasing (اولویت‌دهی به کلمات خاص برای بهبود شناسایی اصطلاحات کمیاب مانند اسامی خاص یا واژگان پزشکی) و ۴۳ زبان، از جمله عربی، ژاپنی و چینی پشتیبانی می‌کند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Microsoft
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 مدل یکپارچه برای وظایف مختلف مکان‌یابی

‏مدل "Locate Anything" انویدیا، یک چارچوب یکپارچه مبتنی بر مدل‌های بینایی-زبان (vision-language models) است که طیف وسیعی از وظایف مکان‌یابی را پوشش می‌دهد. این وظایف شامل درک اسناد (document understanding)، مکان‌یابی عناصر رابط کاربری گرافیکی (GUI grounding)، تشخیص متراکم (dense detection) و تشخیص نوری کاراکتر (OCR) می‌شود.

🔗 Locate Anything Repo
📄 Diverse localization tasks under a unified vision-language model

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #ComputerVision
🤖 ۱۰ کاربرد برتر هوش مصنوعی مولد در ۲۰۲۶

🔍 بر اساس Harvard Business Review، رایج‌ترین مورد استفاده از هوش مصنوعی مولد در سال ۲۰۲۶، همچنان حوزهٔ درمان و همراهی عاطفی است؛ حتی اگر شرکت‌های AI ادعاهای متفاوتی داشته باشند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #GenAI
🤖 ساخت اسلایدهای PPT با هوش مصنوعی متن باز

📊 این ابزار متن باز با ۷ نقش تخصصی AI (مانند strategist و executor) به‌صورت هماهنگ اسلایدهای PowerPoint سطح مشاوران بزرگ را از هر PDF تولید می‌کند؛ شامل ۳۳ قالب نمودار، ۶۴۰ آیکون، و خروجی قابل ویرایش PPTX.
🚀 قابلیت یکپارچه‌سازی با Claude Code، Cursor یا VS Code و ارائه ۱۵ پروژه نمونه با ۲۲۹ اسلاید برای یادگیری عملی.

🔗 ppt‑master

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#ابزار #Claude
Data Science Interview Questions.pdf
1.4 MB
💡 سوالات مصاحبه علم داده
‏مجموعه‌ای از سوالات مصاحبه علم داده برای آمادگی شغلی ارائه شده است. این مجموعه به داوطلبان کمک می‌کند تا مهارت‌های خود را در زمینه‌هایی مانند یادگیری ماشین، یادگیری عمیق، MLOps و مهندسی داده ارتقا دهند.



📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #DataScience
🇺🇸 آمریکا خواستار بررسی مدل‌های پیشرفته هوش مصنوعی قبل از انتشار شد

🇺🇸 دولت آمریکا با امضای یک دستور اجرایی، خواستار بررسی داوطلبانه مدل‌های مرزی (frontier models) قبل از انتشار عمومی شده است. این بررسی شامل سیستم‌هایی می‌شود که توانایی‌های سایبری پیشرفته‌ای مانند یافتن آسیب‌پذیری‌ها یا خودکارسازی عملیات سایبری را دارند. هدف اصلی، دادن فرصت به مدافعان سایبری برای آماده‌سازی پچ‌ها و پروتکل‌های امنیتی است.

🔒 طبق این چارچوب جدید، آزمایشگاه‌های هوش مصنوعی می‌توانند به مدت حداکثر ۳۰ روز دسترسی داوطلبانه به این مدل‌ها را به آژانس‌های فدرال بدهند. نهادهایی مانند NSA و CISA در ارزیابی این مدل‌ها مشارکت خواهند داشت و معیارهای مدل‌های مرزی از طریق فرآیند بنچمارکینگ (benchmarking) داخلی تعیین خواهد شد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #AgentAI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 معرفی CLI کلاود توسط Anthropic

🚀 شرکت Anthropic ابزار خط فرمان (CLI) جدیدی به نام ant برای مدیریت منابع پلتفرم Claude API منتشر کرده است. این ابزار شبیه به gh برای GitHub عمل می‌کند و به کاربران اجازه می‌دهد تا از طریق ترمینال با Claude تعامل داشته باشند، مدل‌ها را لیست کنند و پیام‌ها را ارسال کنند.

💡 ant فراتر از یک رابط ساده برای API است؛ این ابزار امکان تعریف و مدیریت "عامل‌ها" (agents) را با استفاده از فایل‌های YAML فراهم می‌کند. این عامل‌ها به عنوان پیکربندی‌های کامل در نظر گرفته می‌شوند که می‌توانند در Git ذخیره، از طریق Pull Request بازبینی، با CI/CD پیاده‌سازی و بین نسخه‌ها بازگردانی شوند. این رویکرد، مدیریت عامل‌ها را مشابه مدیریت کد می‌کند و قابلیت‌های DevOps را به اکوسیستم Claude می‌آورد.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 ۸ نوع مدل زبان بزرگ (LLM) برای عامل‌های هوش مصنوعی

‏عامل‌های هوش مصنوعی (AI agents) برای انجام وظایف پیچیده فراتر از مکالمه، از انواع مختلفی از مدل‌های زبان بزرگ (LLM) استفاده می‌کنند. این مدل‌ها به عامل‌ها امکان استدلال، درک، برنامه‌ریزی و اقدام را می‌دهند و در واقع نوعی ارکستراسیون مدل (model orchestration) را تشکیل می‌دهند.

برخی از این ۸ نوع LLM کلیدی عبارتند از:
🔹 GPT
🔸 MoE (Mixture of Experts - معماری ترکیبی از شبکه‌های عصبی تخصصی)
🔹 LRM (Long-context Reasoning Model - مدل‌های استدلال برای متون طولانی)
🔸 VLM (Vision-Language Model - مدل‌های چندوجهی بصری-زبانی)
🔹 SLM (Small Language Model - مدل‌های زبانی کوچک و کارآمد)

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#مقاله #AgentAI
🌷الْحَمْدُلِلَّهِ الَّذِی جَعَلَنَا مِنَ الْمُتَمَسِّکِینَ بِوِلاَیَةِ أَمِیرِالْمُؤْمِنِینَ عَلیِّ بنِ أَبِی طالِب وَ الْأَئِمَّةِ الْمَعصومیٖن عَلَیْهِمُ السَّلاَمُ🌷

عیدالله الاکبر، عید غدیر خم بر همه شیعیان امیرالمومنین علی علیه‌السلام تبریک و تهنیت باد.



برای آموزش علم داده به جمع ما بپیوندید: 👇

📊👨‍🏫 @DataPlusScience | @DataScience
1