هوش مصنوعی و علم داده به فارسی
6.08K subscribers
980 photos
262 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 رشد شگفت‌انگیز Anthropic به ۹۶۵ میلیارد دلار

🔹 Anthropic در آخرین دور سرمایه‌گذاری ۶۵ میلیارد دلار جذب کرد و پس از آن ارزش کل شرکت به ۹۶۵ میلیارد دلار رسید.
🔸 این افزایش ارزش نسبت به سه ماه پیش که تنها ۳۰ میلیارد دلار با ارزش ۳۸۰ میلیارد دلاری داشت، بیش از ۲٫۵  برابر است.
💡 Claude (مدل زبانی Anthropic) نقش کلیدی در این رشد داشته و درآمد سالیانه شرکت از پلتفرم‌های هوش مصنوعی به بیش از ۴۷ میلیارد دلار رسیده است.


🔹 سرمایه‌گذاران استراتژیک: سامسونگ، SK Hynix و Micron به عنوان شرکای زیرساختی مشارکت کردند؛ این نشان می‌دهد رقابت هوش مصنوعی به فقط مدل‌ها محدود نیست بلکه به دسترسی به حافظه، GPU و دیتاسنترها هم گسترش یافته است.


📊 DataScience — هوش مصنوعی و علم داده به فارسی 🇮🇷
📩 ارتباط با ما


#خبر #Anthropic
💰 Anthropic با ارزش‌گذاری 965 میلیارد دلاری 65 میلیارد دلار جذب کرد

💡 شرکت Anthropic با جذب سرمایه 65 میلیارد دلاری و رسیدن به ارزش‌گذاری 965 میلیارد دلاری، رسماً از OpenAI پیشی گرفت. درآمد سالانه تکرارشونده (ARR) این شرکت نیز در ماه جاری از مرز 47 میلیارد دلار عبور کرده است.


🔹 ارزش‌گذاری: Anthropic اکنون با ارزش 965 میلیارد دلار، از نظر مالی بزرگتر از OpenAI محسوب می‌شود.
🔸 درآمد: درآمد سالانه تکرارشونده (ARR) این شرکت به بیش از 47 میلیارد دلار رسیده است.


📊 DataScience — هوش مصنوعی و علم داده به فارسی 🇮🇷
📩 ارتباط با ما


#خبر #Anthropic
This media is not supported in your browser
VIEW IN TELEGRAM
🛡️ دفاع سایبری هوش مصنوعی گوگل

‏گوگل از راه‌اندازی «Google AI threat defense» خبر داد، یک راه‌حل امنیت سایبری جدید مبتنی بر هوش مصنوعی که برای نظارت مستمر و توقف تهدیدات سایبری تقویت‌شده با AI، قبل از تأثیرگذاری بر کسب‌وکارها، طراحی شده است.


🔹 این سیستم با ترکیب فناوری‌هایی مانند Wiz (پلتفرم مدیریت ریسک ابری)، مدل‌های هوش مصنوعی پیشرفته Gemini و سایر مدل‌های پیشرو هوش مصنوعی (frontier AI models)، امنیت را تقویت می‌کند.
🔸 همچنین، CodeMender (ابزاری برای ترمیم خودکار کد) و ایجنت‌های امنیتی خودکار (autonomous security agents) نیز بخشی از این راه‌حل هستند.
💡 هدف اصلی این سیستم اولویت‌بندی ریسک‌ها، اسکن برنامه‌ها، شناسایی آسیب‌پذیری‌ها و تسریع فرآیند رفع اشکالات امنیتی است.


📊
DataScience
— هوش مصنوعی و علم داده به فارسی
📩
ارتباط با ما


#خبر #Google
🤖 پلتفرم AI برای کشف دارو در چین

🔹 چین یک پلتفرم هوش مصنوعی برای کشف دارو راه‌اندازی کرده که کتابخانه‌های بزرگ ترکیبات شیمیایی را در ثانیه‌ها اسکن می‌کند؛ زمان غربالگری اولیه که پیشتر ماه‌ها یا سال‌ها طول می‌کشید، به چند ثانیه کاهش یافته است.
🔸 این پیشرفت نشانگر تغییر اساسی در زمان‌بندی پژوهش‌های زیست‌فناورانه در اواخر دهه ۲۰۲۰ است و نشان می‌دهد ابزارهای مبتنی بر AI می‌توانند فرایندهای پیش‌دارویی را به‌صورت لحظه‌ای انجام دهند.
💡 با ادغام گسترده هوش مصنوعی در بیوتکنولوژی، انتظار می‌رود سرعت توسعهٔ داروها به‌طور چشمگیری افزایش یابد.

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #DrugDiscovery
🤖 مدل 8B پارامتری MoE برای اجرا روی دستگاه‌های معمولی

‏شرکت Liquid AI مدل LFM2.5-8B-A1B را معرفی کرده است؛ یک مدل Mixture-of-Experts (MoE) با 8 میلیارد پارامتر که تنها 1.5 میلیارد پارامتر آن در هر مرحله فعال است. این مدل برای اجرا روی دستگاه‌هایی مانند تلفن‌های همراه، لپ‌تاپ‌ها و ربات‌ها بهینه‌سازی شده است.

این معماری هیبریدی MoE از خط تولید LFM2.5 بهره می‌برد و دارای پنجره زمینه (context window) 128 هزار توکن است. مدل بر روی 38 تریلیون توکن پیش‌آموزش دیده و سپس با استفاده از یادگیری تقویتی (RL) تقویت شده است.

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #LiquidAI
This media is not supported in your browser
VIEW IN TELEGRAM
ابزاری برای عبور از محدودیت‌های توکن در مدل‌های زبانی بزرگ

‏این ابزار یک افزونه مرورگر است که به کاربران اجازه می‌دهد مکالمات خود را با مدل‌های زبانی بزرگ مانند ChatGPT، Gemini و Claude بین اکانت‌های مختلف منتقل کنند. این قابلیت به طور چشمگیری در مصرف توکن صرفه‌جویی کرده و از نیاز به کپی دستی پرامپت‌ها و پاسخ‌ها جلوگیری می‌کند.


🔹 قابلیت‌ها: این افزونه قادر است مکالمات را بین اکانت‌ها منتقل کرده، زمینه، نتایج و داده‌های مهم را حفظ کند و کار با مدل‌ها را پس از رسیدن به محدودیت توکن، تسهیل نماید.
🔸 کاربرد: برای افرادی که به طور مداوم با مدل‌های زبانی کار می‌کنند، این ابزار یک راهکار کارآمد برای حفظ پیوستگی مکالمات و جلوگیری از اتلاف وقت در کپی دستی محسوب می‌شود.


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🛠 بهینه‌سازی توکنایزر Unigram توسط Perplexity AI

‏شرکت Perplexity AI یک پیاده‌سازی جدید و متن‌باز از توکنایزر Unigram را منتشر کرده است که توانسته مصرف CPU را تا 5-6 برابر در محیط عملیاتی کاهش دهد. این بهبود عمدتاً به دلیل رفع گلوگاه‌های موجود در بخش توکنیزاسیون بوده است، نه خود مدل.

🔹 توکنیزاسیون CPU، نه مدل، گلوگاه اصلی بود، به خصوص برای مدل‌های کوچک‌تر که زمان پردازش GPU آن‌ها بسیار کوتاه است.
🔸 پیاده‌سازی مرجع دارای الگوهای پرهزینه‌ای بود: بیش از 7000 تخصیص حافظه (heap allocation) برای هر encode و استفاده از HashMap در هر گره از ساختار Trie که منجر به افزایش نرخ miss در کش L2 می‌شد.
💡 با رفع مشکل تخصیص حافظه قبل از هرگونه تغییر در ساختار Trie، زمان پردازش از 326 میکروثانیه به 155 میکروثانیه کاهش یافت.
سه بهینه‌سازی کلیدی منجر به نتیجه نهایی شدند: استفاده از Double-array trie، بسته‌بندی داده‌ها با Bitmap و cache-line packing، و استفاده از huge pages (2MB) برای کاهش دسترسی به حافظه.
🚀 در نهایت، توکنایزر جدید Perplexity با حدود 63 میکروثانیه و بدون تخصیص حافظه، عملکردی 3.5 برابر بهتر نسبت به پیاده‌سازی Hugging Face (349 میکروثانیه و 7295 تخصیص) در پردازش 514 توکن نشان داد.


📌 جزئیات فنی: پیاده‌سازی جدید از ساختار Double-array trie استفاده می‌کند که به جای 4 بار بارگذاری وابسته در هر بایت، تنها به 2 بار خواندن آرایه و 1 اضافه کردن نیاز دارد.
📌 بهینه‌سازی حافظه: استفاده از 2MB huge pages باعث می‌شود کل Trie (50MB) در 25 صفحه قرار گیرد، در حالی که حالت قبل در 12000 صفحه پخش می‌شد و کاملاً در TLB (Translation Lookaside Buffer) جای می‌گیرد.
📌 مقایسه عملکرد: در تست با 514 توکن روی پردازنده Intel Xeon Platinum 8488C، توکنایزر Perplexity (حدود 63 میکروثانیه) از SentencePiece (128 میکروثانیه) و IREE (112 میکروثانیه) نیز سریع‌تر عمل کرد.


🔗 تحلیل کامل
🔗 مخزن GitHub
🔗 جزئیات فنی Perplexity

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #PerplexityAI
🤖 ساخت مدل زبانی بزرگ (LLM) از ابتدا

‏این مجموعه ویدئویی شامل ۴۳ سخنرانی است که نحوه ساخت یک مدل زبانی بزرگ (LLM) را از ابتدا آموزش می‌دهد. هدف آن روشن کردن عملکرد داخلی مدل‌هایی مانند ChatGPT است.
این دوره مفاهیم کلیدی مانند معماری Transformer، ساختار داخلی GPT، Tokenization و BPE (Byte Pair Encoding)، مکانیزم‌های Attention (توجه) و فرآیند آموزش LLM را به صورت گام به گام و با پیاده‌سازی کامل در Python توضیح می‌دهد.

https://www.youtube.com/playlist?list=PLPTV0NXA_ZSgsLAr8YCgCwhPIJNNtexWu

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#آموزش #Transformer
Media is too big
VIEW IN TELEGRAM
💻 کنترل ویندوز با ChatGPT ممکن شد

‏اکنون با استفاده از اپلیکیشن ChatGPT، امکان کنترل کامپیوترهای ویندوزی از راه دور فراهم شده است. این قابلیت به کاربران اجازه می‌دهد تا وظایف کدنویسی را روی رایانه شخصی خود از راه دور آغاز، نظارت و تنظیم کنند.

🔹 کاربرد: این ویژگی جدید برای پشتیبانی از کاربرانی طراحی شده که روی وظایف کدنویسی به صورت ریموت کار می‌کنند و اطمینان می‌دهد که کار روی کامپیوتر در حالی که دستورات از دستگاه دیگری صادر می‌شود، ادامه یابد.
🔸 مدیریت وظایف: کاربران می‌توانند شروع، پیگیری و تنظیم وظایف برنامه‌نویسی را مستقیماً از طریق اپلیکیشن موبایل ChatGPT مدیریت کنند.

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #AgentAI
انویدیا میلیاردها دلار صرف جایگزینی مس با نور در مراکز داده هوش مصنوعی می‌کند

🚀 انویدیا با تعهد بیش از ۶.۵ میلیارد دلار در حوزه فوتونیک (تکنولوژی انتقال داده با نور به جای سیگنال‌های الکتریکی از طریق کابل‌های مسی)، به دنبال غلبه بر محدودیت‌های فیزیکی سیم‌کشی مسی در خوشه‌های عظیم هوش مصنوعی است. این سرمایه‌گذاری شامل قراردادهای قابل توجهی با شرکت‌هایی مانند Coherent، Lumentum، Corning و Marvell Technology و همچنین مشارکت در Ayar Labs می‌شود.

📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Nvidia
🤖 خلاصه تحولات هوش مصنوعی
━━━━━━━━━━━━━━━
📅 دوره: 24 ساعت گذشته | شماره #1
از جمعه 1405/03/08 ساعت 14:00
تا شنبه 1405/03/09 ساعت 14:00
━━━━━━━━━━━━━━━

🏷 هوش مصنوعی مولد و مدل‌های زبانی بزرگ (LLMs)

آموزش ساخت مدل‌های زبانی بزرگ (LLM) شبیه GPT از ابتدا با PyTorch، با تقسیم‌بندی معماری پیچیده به بخش‌های ساده‌تر در ۱۰ نوت‌بوک عملی. [1]
💡 تحقیقات جدید از دانشگاه‌های برجسته نشان می‌دهد که مدل‌های زبانی بزرگ (LLM) فعلی در پیش‌بینی اکتشافات علمی آینده عملکرد ضعیفی دارند. [2]
🚀 مایکروسافت SkillOpt را معرفی کرده است؛ روشی نوآورانه برای آموزش مهارت‌های ایجنت‌های هوش مصنوعی بدون نیاز به بازآموزی مدل پایه، با تمرکز بر آموزش فایل دستورالعمل‌ها. [3]
💡 مخزن جامع transformers-the-definitive-guide پیاده‌سازی‌های Transformer را برای بینایی ماشین، پردازش صوتی و عوامل هوش مصنوعی با مثال‌های کاربردی ارائه می‌دهد. [4]
یک ابزار افزونه مرورگر برای انتقال مکالمات با مدل‌های زبانی بزرگ (مانند ChatGPT و Claude) بین اکانت‌های مختلف، که به طور چشمگیری در مصرف توکن صرفه‌جویی می‌کند. [5]


🏷 سرمایه‌گذاری و اقتصاد هوش مصنوعی

💰 شرکت Anthropic با جذب ۶۵ میلیارد دلار سرمایه، به ارزش‌گذاری ۹۶۵ میلیارد دلاری رسید و از OpenAI پیشی گرفت؛ درآمد سالانه تکرارشونده (ARR) این شرکت نیز از مرز ۴۷ میلیارد دلار عبور کرده است. [1] [2]
🚀 انویدیا بیش از ۶.۵ میلیارد دلار در حوزه فوتونیک (انتقال داده با نور) سرمایه‌گذاری می‌کند تا محدودیت‌های سیم‌کشی مسی در مراکز داده هوش مصنوعی را برطرف کند. [3]


🏷 ابزارها، فریم‌ورک‌ها و بهینه‌سازی

🛠 Perplexity AI یک پیاده‌سازی متن‌باز و بهینه‌شده از توکنایزر Unigram منتشر کرده که مصرف CPU را تا ۵-۶ برابر کاهش داده است. [1]


🏷 مسیرهای یادگیری و دوره‌های آموزشی

🚀 نقشه راه جامع ۸ مرحله‌ای برای مهندسی هوش مصنوعی، از مبانی برنامه‌نویسی تا استقرار مدل‌ها و پروژه‌های واقعی. [1]
🚀 دوره متن‌باز مهندسی هوش مصنوعی با بیش از ۴۳۵ درس و ۳۲۰ ساعت محتوا، با تمرکز بر Python، TypeScript و Rust برای ساخت AI agents. [2]


🏷 پیشرفت‌ها و کاربردهای هوش مصنوعی

🚀 شیائومی قیمت API مدل‌های MiMo-V2.5 را به طور قابل توجهی کاهش داده است، که منجر به کاهش هزینه‌های ورودی و تولید توکن می‌شود. [1]
💡 وایت‌پیپر "AI-Disrupt PDLC" اسبربانک، گذار به توسعه نرم‌افزار مبتنی بر عامل (agent-based development) و تغییر پارادایم از کدنویسی به تعریف قصد (intent) را تشریح می‌کند. [2]
🚀 چین یک پلتفرم هوش مصنوعی برای کشف دارو راه‌اندازی کرده که زمان غربالگری اولیه ترکیبات شیمیایی را از ماه‌ها و سال‌ها به چند ثانیه کاهش داده است. [3]


📊 DataScience — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 مدل Qwen-VLA برای کنترل ربات‌های متنوع معرفی شد

‏شرکت Qwen (زیرمجموعه Alibaba) از مدل Qwen-VLA رونمایی کرده است که قادر به کنترل انواع ربات‌ها بدون نیاز به تنظیمات مجزا برای هر پلتفرم است. این مدل با دریافت تصویر و دستور متنی، اقدامات لازم را برای ربات خروجی می‌دهد و وظایفی چون دستکاری اشیاء، ناوبری و پیش‌بینی مسیر را پوشش می‌دهد.

🔹 این مدل بر پایه Qwen3.5-4B ساخته شده و با یک دیکودر ۱.۱۵ میلیارد پارامتری تکمیل شده است. قابلیت کلیدی Qwen-VLA، امکان جابجایی بین ربات‌های مختلف تنها با تغییر دستورالعمل متنی است.

🔸 عملکرد Qwen-VLA در بنچمارک‌های مختلف شامل LIBERO (۹۷.۹٪) و RoboTwin-Hard (۸۷.۲٪) بوده است. در آزمایش با ربات دو دست ALOHA، موفقیت در اجرای وظایف در محیط‌های آشنا ۸۳.۶٪ و در محیط‌های ناآشنا ۷۶.۹٪ گزارش شده است.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Qwen
1
🚀 پیش‌بینی رشد شگفت‌انگیز Anthropic

امروزه سرمایه‌گذار جوزف جک پیش‌بینی می‌کند که Anthropic تا اواسط ۲۰۲۸ می‌تواند درآمدش را به حدود $575 میلیارد برساند و از Alphabet پیشی بگیرد. رشد ARR این شرکت از $۱ میلیارد در ژانویه ۲۰۲۵ به $۳۰ میلیارد در آوریل ۲۰۲۶ (۳٫۳ بار در ۴ ماه) نشان از شتاب‌گیری دارد. حتی در سناریوی کندی، انتظار می‌رود تا ۲۰۲۹ به $۱٫۴ تریلیون و تا ۲٫۰ تریلیون در ۲۰۳۰ برسد.

علاوه بر این، تعداد مشتریانی که بیش از $۱ میلیون سالانه خرج می‌کنند از ۵۰۰ به ۱۰۰۰ در کمتر از دو ماه افزايش یافته و تقاضا برای توکن‌های Gemini تنها ۶۰ ٪، در حالی که توکن‌های Anthropic ده برابر شده است؛ این نشان از توان مقیاس‌پذیری و نفوذ در بازار انتروپیک است

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Anthropic
🔹 پیشرفت Anthropic در پیاده‌سازی AI

💡 Anthropic با ۳۴٫۴٪ نرخ پیاده‌سازی AI در کسب‌وکار، پیش از OpenAI (۳۲٫۳٪) می‌آید؛ اما گزارش AI Index از Ramp هشدار می‌دهد که این برتری موقت است، چرا که هزینهٔ استفاده از مدل‌های این شرکت به‌تازگی سه‌برابر شده، به‌ویژه برای پرامپت‌های تصویری.


🔸 Uber: کل بودجهٔ AI خود را تا سال ۲۰۲۶ صرف کرده و دیگر نمی‌تواند سرمایه‌گذاری افزایشی داشته باشد.
📊 روند بازار: پلتفرم‌های inference با ارائه دسترسی به مدل‌های open‑source ارزان، سریع‌ترین رشد را در Ramp نشان می‌دهند.
🚀 چالش Anthropic: اگرچه در پیاده‌سازی پیشتاز است، اما افزایش قیمت استفاده می‌تواند رقبا را به‌سوی گزینه‌های کم‌هزینه‌تر سوق دهد.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #Anthropic
🚀 تنسنت مدل‌های ترجمه ماشینی Hy-MT2 را معرفی کرد

‏شرکت تنسنت مجموعه‌ای از مدل‌های ترجمه ماشینی به نام Hy-MT2 را منتشر کرده است که در سه نسخه ۱.۸ میلیارد، ۷ میلیارد و ۳۰ میلیارد پارامتری عرضه می‌شوند. این مدل‌ها از ترجمه بین ۳۳ زبان پشتیبانی می‌کنند و قابلیت اجرا بر روی دستگاه‌های با منابع محدود، حتی با کوانتیزاسیون ۱.۲۵ بیتی، را دارند.

🔹 سرعت و کارایی: نسخه با کوانتیزاسیون ۱.۲۵ بیتی حجمی حدود ۴۴۰ مگابایت دارد و قادر است بدون نیاز به اینترنت بر روی چیپ‌های موبایل اجرا شود. سرعت پردازش این نسخه بر روی Apple A15، ۱.۵ برابر سریع‌تر از مدل قبلی Hy-MT1.5 با کوانتیزاسیون ۴ بیتی است.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما
🤖 توکن‌ها و هزینه‌های هوش مصنوعی توسط عامل‌ها

🔹 در مقایسه با چت‌بات‌های ساده، AI‑agent (عامل هوش مصنوعی) با برنامه‌ریزی، فراخوانی ابزارها، بررسی نتایج و اصلاح خطاها، نیاز به توکن‌های بسیار بیشتری دارد؛ گاهی تا ۵۰‑۱۰۰ برابر بیشتر.

🔸 گلدمن ساکس پیش‌بینی می‌کند تا سال ۲۰۳۰ مصرف توکن‌های این عامل‌ها می‌تواند ۲۴ برابر رشد کند و در سناریوی خوش‌بین به ۱۲۰ کادریلین توکن در ماه برسد.

💡 باوجود کاهش قیمت توکن به‌صورت سالانه (۶۰‑۷۰٪)، چالش اصلی تبدیل به تعادل بین بهره‌وری عامل‌ها و هزینه توکنی شده؛ شرکت‌های بزرگ مثل Uber و Microsoft نیز در حال بازنگری استفاده گران‌قیمت از این تکنولوژی هستند. منبع

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#خبر #AgentAI
📊 بیش از ۸۰٪ شرکت‌ها از هوش مصنوعی بازدهی ندیده‌اند

‏تحقیقات اخیر نشان می‌دهد که با وجود سرمایه‌گذاری‌های کلان، بیش از ۸۰٪ شرکت‌ها هنوز شاهد افزایش بهره‌وری ناشی از هوش مصنوعی نبوده‌اند. از ۶۰۰۰ مدیر مورد بررسی، تنها یک سوم از هوش مصنوعی در محل کار استفاده می‌کنند، آن هم به طور متوسط حدود ۹۰ دقیقه در هفته. ۲۵٪ از پاسخ‌دهندگان نیز اعلام کردند که اصلاً از ابزارهای هوش مصنوعی استفاده نکرده‌اند.

🚀 انتظار می‌رود در سه سال آینده، هوش مصنوعی بهره‌وری را ۱.۴٪، نیروی کار را ۰.۷٪ کاهش و خروجی را ۰.۸٪ افزایش دهد. در همین حال، پیش‌بینی می‌شود استفاده از توکن‌ها توسط عامل‌های هوش مصنوعی (AI agents) تا سال ۲۰۳۰ به طور چشمگیری افزایش یابد و فشارهای هزینه‌ای جدیدی را به این حوزه وارد کند.

📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما


#گزارش #Microsoft