Silicon Brain | جامعه هوش مصنوعی

شیر یا خط اومدن در پرتاب سکه واقعا تصادفی است؟ آیا کامپیوتر می‌تونه اعداد تصادفی واقعی تولید می‌کنه؟

Anonymous Quiz

21%

👍3❤1👎1

396 voters1.69K views10:59

Silicon Brain | جامعه هوش مصنوعی

۹ سال پیش Karpathy گفته بود Gradient Descent بهتر از انسان کد میزنه

👍17❤6🔥3

1.73K views10:18

Silicon Brain | جامعه هوش مصنوعی

یه تحقیق جدید روی بیشتر از ۲۰۰۰ training run انجام شده تا بفهمن راز ساخت Mixture of Experts (MoE) بهتر چیه

مدل‌های MoE اینجوری کار می‌کنن که همه بخش‌های مدل هم‌زمان فعال نیستن. یعنی بیشتر model «خوابه» و فقط یه بخش کوچیک (expert) برای هر input فعال می‌شه.

مثل بیمارستانی که به‌جای اینکه همه دکترها همه مریض‌ها رو ببینن، هر مریض می‌ره پیش متخصص خودش. نتیجه؟ سریع‌تر، ارزون‌تر و بهینه‌تر.

مشکل این بود که کسی دقیق نمی‌دونست توی طراحی MoE چه چیزهایی واقعاً مهمن. برای همین تیم تحقیقاتی بیش از ۲۰۰۰ مدل مختلف آموزش داده تا جوابشو پیدا کنه.

نتایج

🔹هرچی تعداد expertها بیشتر باشه، عملکرد بهتر می‌شه؛ حتی وقتی تعداد parameterهای غیرفعال خیلی بیشتر از activeها باشه
🔹اندازه expertها باید بر اساس active parameter budget تنظیم بشه، بعدش می‌تونی expert بیشتری اضافه کنی
🔹چیزهایی مثل shared experts یا اندازه‌های ترکیبی فقط complexity اضافه می‌کنن و سود خاصی ندارن
🔹مهم‌ترین نکته اینه که موقع routing، token dropping اتفاق نیفته؛ بقیه موارد تاثیر خیلی کمی دارن
خلاصه تحقیق:

برای ساخت MoE لازم نیست بیش‌ازحد معمای رو پیچیده کنی؛ فقط تعداد expertها و اندازه‌شون رو درست تنظیم کن، بقیه چیزها اهمیت زیادی ندارن

لینک مقاله
@silicon_brain I از هوش مصنوعی عقب نمانید

👍7❤4⚡1

1.88K viewsedited 13:33

Silicon Brain | جامعه هوش مصنوعی

Forwarded from Silicon Brain | جامعه هوش مصنوعی

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

لیست مدل‌های در دسترس در پلتفرم هوش مصنوعی ژرف
میتونین مدل‌های متنی و تصویری شرکت‌های مختلف رو فیلتر و مقایسه کنین
chat.zharph.com

❤5👍2👎1😍1

1.6K views16:08

Silicon Brain | جامعه هوش مصنوعی

تو این مدت...

Anonymous Poll

14%

آپدیت بودم و تمامی مطالب روز هوش مصنوعی رو خوندم

38%

بعضی از مطالب هوش مصنوعی رو خوندم

41%

هیچی نخوندم و چیزی در مورد هوش مصنوعی روز نمیدونم

نه قبلا چیزی میدونستم نه الان چیزی میدونم

286 voters1.73K views19:54

Silicon Brain | جامعه هوش مصنوعی

برای AI Engineering یه عالمه اصطلاح هست که شبیه هم به نظر میان، ولی معنی کاملاً متفاوتی دارن.
مثل:

Authentication vs Authorization

Authentication
مثلاً login کردن با password یا JWT token
Authorization
یعنی: به چی اجازه دسترسی داری؟
مثلاً یه user عادی نمی‌تونه به admin panel دسترسی داشته باشه.

Latency vs Throughput Latency

Latency
یعنی سرعت پاسخ‌دهی به یه request مثلاً API تو توی ۲۰۰ms جواب می‌ده.

Throughput
یعنی سیستم در کل چند request رو می‌تونه هندل کنه.
مثلاً ۱۰هزار request در ثانیه.

ممکنه latency خوب باشه ولی throughput ضعیف؛ یعنی هر request سریع جواب بگیره، ولی سیستم زیر load سنگین crash کنه.

Rate Limiting vs Throttling

Rate Limiting
یعنی محدود کردن تعداد requestها.
مثلاً هر user فقط ۱۰۰ request در دقیقه.
Throttling
یعنی وقتی سیستم تحت فشار رفت، requestها رو آهسته یا محدود کنیم تا server نابود نشه

Tool vs MCP

Tool
یعنی یه قابلیت که AI می‌تونه صداش کنه.
مثلاً search، database query یا اجرای کد
MCP
یه protocol استاندارده که AI رو به toolها و data sourceها وصل می‌کنه.

Memory vs Context Engineering

Memory چیزیه که AI در طول زمان نگه
می‌داره.
مثلاً اینکه اسم user چیه یا پروژه قبلیش چی بوده.
Context Engineering
یعنی ما تصمیم بگیریم همین الان چه اطلاعاتی به مدل نشون داده بشه.

توی AI appها، context engineering خیلی مهم‌تر از prompt engineering هست

Load Balancer vs API Gateway

Load Balancer
ترافیک رو بین چند server پخش می‌کنه تا overload نشه.
API Gateway
ورودی همه APIها رو مدیریت می‌کنه؛ مثل authentication، rate limiting، logging و routing.

@silicon_brain I از هوش مصنوعی عقب نمانید

👍10❤4🔥3❤‍🔥1

1.64K viewsedited 19:13

Silicon Brain | جامعه هوش مصنوعی

مدل جدید ‏Google DeepMind به اسم Gemini Embedding 2 (GE 2) می‌تونه هم‌زمان متن، تصویر، صدا و ویدیو رو داخل یه فضای مشترک بفهمه

مدل‌های embedding معمولاً هر ورودی رو تبدیل به یه بردار عددی می‌کنن تا AI بتونه معنی و شباهت بین دیتاها رو بفهمه. پشت‌صحنه تقریباً همه سیستم‌های semantic search، recommendation system و RAG همین embeddingها کار می‌کنن.

این مدل با استفاده از contrastive learning روی benchmarkهای مهم مثل MSCOCO، Vatex، MTEB multilingual و MTEB Code عملکرد state-of-the-art داشته

گوگل می‌گه این مدل می‌تونه برای RAG، semantic search، recommendation system و AI assistantهای multimodal خیلی کاربردی باشه

لینک مقاله
@silicon_brain | از هوش مصنوعی عقب نمانید

❤7👍5

1.75K viewsedited 10:24

Silicon Brain | جامعه هوش مصنوعی

سوالات مهم در مصاحبه پوزیشن
GenAl / Agentic Al Engineer

Round 1 - Technical Questions

🔹️ What is Generative Al?
🔹️ Explain Retrieval-Augmented Generation (RAG)
🔹️What are embeddings in Al svstems?
🔹️Explain chunking in RAG pipelines.
🔹️Difference between fine-tuning and prompt engineering?
🔹️What is AWS Bedrock?
🔹️Explain Claude and Titan models in AWS Bedrock.
🔹️What are guardrails in GenAl systems
🔹️Explain LangChain architecture.
🔹️What is LangGraph used for?
🔹Explain agentic Al workflows.
🔹Difference between single-step and multi-step agents?
🔹️What are vector databases?
🔹️Explain API integration in GenAl applications
🔹️What is grounding in RAG systems
🔹️Explain token usage optimization
🔹What are hallucinations in LLMs
🔹How do you reduce hallucinations
🔹Explain prompt engineering techniques
🔹️What is asynchronous programmina in Pvthon?
🔹️Explain OOP concepts in Python
🔹️What are pytest fixtures?
🔹️ Explain Docker basics.
🔹️What is CI/CD pipeline?
🔹️Explain model latency optimization
🔹️ What is retrieval intearation in Bedrock?
🔹️Explain LLM evaluation methods
🔹️What is Git branching strategy?
🔹️How do you secure GenAl applications?
🔹Explain production deployment of Al systems

❤13👍4🔥1

1.42K viewsedited 15:23

Silicon Brain | جامعه هوش مصنوعی

انودیا یه روش جدید به اسم X-Token معرفی کرده که یه مشکل مهم توی Knowledge Distillation (KD) رو حل می‌کنه. معمولاً برای انتقال دانش از یه teacher model بزرگ به یه student model کوچیک، هر دو مدل باید از یه tokenizer استفاده کنن.

اما مدل‌هایی مثل Llama، Qwen و Phi tokenizerهای متفاوتی دارن و همین باعث می‌شه نتونن به‌خوبی از هم یاد بگیرن.
روش‌های قبلی مثل ULD و GOLD سعی کرده بودن این مشکل رو حل کنن، ولی وقتی دو tokenizer متن رو به شکل متفاوتی تکه‌تکه می‌کردن (مثلاً یک عدد را یک مدل در یک token و مدل دیگر در چند token ذخیره می‌کرد)، کیفیت distillation به‌شدت افت می‌کرد.

اما X-Token این محدودیت رو برطرف می‌کنه. مزیتش اینه که بدون تغییر معماری مدل و بدون اضافه کردن component جدید، به‌عنوان جایگزین مستقیم KD loss قابل استفاده است.

نتیجه

انودیا گزارش داده X-Token به‌طور میانگین 3.82 امتیاز بهتر از GOLD هست و به مدل‌های کوچیک اجازه می‌ده از teacherهای قوی‌تری مثل Qwen3-4B یا Phi-4-mini یاد بگیرن حتی اگر tokenizerهای کاملاً متفاوتی داشته باشن.

@silicon_brain I از هوش مصنوعی عقب نمانید

❤9👍5🔥3

1.65K viewsedited 16:04

Silicon Brain | جامعه هوش مصنوعی

پارامتر‌های مهم برای یک مدل دیپلوی شده که باید مورد توجه باشه

Scalability

افزایش ناگهانی ترافیک و تعداد درخواست‌ها

Latency

مدل‌های بزرگ سرعت پاسخ‌دهی پایینی دارن

Cost

منابع GPU هزینه‌بر هستن

Monitoring

🔹️ارزیبای کیفیت پاسخ ها
🔹️خطاها (Errors)
🔹️توهم مدل(Hallucinations)

Security

محافظت از داده‌های حساس (Sensitive Data)

Versioning

نیاز به Model Version Control برای مدیریت نسخه‌های مختلف مدل

تنظیم و بررسی این پارامتر‌ها کیفیت نهایی مدل ساخته شده برای end-user رو تعیین میکنه

@silicon_brain I از هوش مصنوعی عقب نمانید

❤5👍2🙏1

1.88K viewsedited 17:35

Silicon Brain | جامعه هوش مصنوعی

Anonymous Poll

63%

خیلی وقته تو این کانالم و مطالب خوبی یاد گرفتم

21%

خیلی وقته تو این کانالم و چیزی یاد نگرفتم

11%

جدیدا اومدم تو این کانال و مطلب خوبی رو میخونم اینجا

جدیدا اومدم تو کانال و چیزی هم نمیخونم

153 voters1.88K views17:40

Silicon Brain | جامعه هوش مصنوعی

شرکت Anthropic داره خودش رو برای ورود به بازار بورس آماده می‌کنه

ارزش Anthropic حدود 965 میلیارد دلار گزارش شده که از OpenAI (852 میلیارد دلار) هم بیشتره. همچنین revenue run-rate شرکت از 9 میلیارد دلار آخر سال قبل به 47 میلیارد دلار رسیده؛ رشد بزرگی که بیشتر به خاطر استفاده enterprise از Claude برای coding و workflow automation بوده.

البته هنوز قیمت سهم یا زمان دقیق عرضه مشخص نیست. ولی این حرکت نشون می‌ده Anthropic داره خودش رو برای ورود به فضای public market و شفافیت مالی بیشتر آماده می‌کنه

اتفاقی که می‌تونه روی آینده ابزارهایی مثل Claude و Claude Code هم تأثیر زیادی داشته باشه

@silicon_brain I از هوش مصنوعی عقب نمانید

❤7👍2⚡1

1.36K views15:00

Silicon Brain | جامعه هوش مصنوعی

اخیرا OpenAI یه پلتفرم جدید به اسم Rosalind Biodefense معرفی کرده که مدل هوش مصنوعی تخصصی خودش در حوزه زیست‌شناسی یعنی GPT-Rosalind رو در اختیار تیم‌هایی قرار می‌ده که روی مقابله با همه‌گیری‌ها و امنیت زیستی کار می‌کنن.

این مدل برای کارهای علمی و زیستی ساخته شده و می‌تونه روی مولکول‌ها، پروتئین‌ها، ژن‌ها و داده‌های مربوط به بیماری‌ها تحلیل و استدلال انجام بده. کاربردش توی جمع‌بندی تحقیقات (evidence synthesis)، ساخت فرضیه (hypothesis generation)، طراحی آزمایش (experiment design) و تحلیل داده‌هاست؛

یعنی مثل یه دستیار هوشمند برای آزمایشگاه‌های تحقیقاتی عمل می‌کنه.

از این پلتفرم می‌شه برای مدل‌سازی شیوع بیماری (epidemiological modeling)، سیستم‌های هشدار زودهنگام (early-warning systems)، برنامه‌ریزی برای مقابله با شیوع، توسعه روش‌های تشخیص (diagnostics) و حتی طراحی واکسن و مهندسی پروتئین استفاده کرد.

نکته مهم اینه که دسترسی به GPT-Rosalind برای تیم‌های تأییدشده رایگانه و هزینه استفاده رو OpenAI پرداخت می‌کنه

@silicon_brain I از هوش مصنوعی عقب نمانید

❤13👍2

1.46K views15:10

Silicon Brain | جامعه هوش مصنوعی

🔴 طبق گزارش WSJ، شرکت Anthropic خواستار یه توقف جهانی (global pause) در توسعه AI شده و هشدار داده که مدل‌های فعلی دارن به نقطه‌ای نزدیک می‌شن که بتونن بدون human oversight (نظارت انسانی) خودشون رو بهبود بدن.

این شرکت های AI هم خودشونو مسخره کردن، همین Anthropic مدام در حال رقابت با OpenAI، گوگل و Alibaba و .... برای تولید مدل های خفنه. هشدارشو به ما میده که اگه فرداروزی یه مشکلی پیش اومد بگه من قبلا گفتم مدل ها دارن از کنترل خارج میشن 😐

@silicon_brain | از هوش مصنوعی عقب نمانید

👍13🔥6👎2🌚1

1.49K views20:53

Silicon Brain | جامعه هوش مصنوعی

حقیقتا دلم برای روزایی که Transformer تازه معرفی شده بود تنگ شده.
انگار همه‌چی تازه شروع شده بود. مدل‌ها، مقالات و ایده‌ها برای همه در دسترس بودن. Hugging Face تازه داشت رشد می‌کرد و یه حس قشنگ از دموکراسی توی AI شکل گرفته بود.
همه داشتن تحقیق می‌کردن، مدل آموزش میدادن...

الان ولی همه‌چی افتاده دست چند تا شرکت غول. از R&D گرفته تا سرو مدل‌ها، APIها، سرویس‌دهی و کل بیزینس AI رو گرفتن دستشون.

ما هم تهش هنر کنیم یه RAG روی مدل‌های خودشون می‌سازیم، چند تا tool وصل می‌کنیم، اسمشو می‌ذاریم محصول AI و خوشحال می‌شیم :)

👍81👎7❤5

1.67K viewsedited 21:10

Silicon Brain | جامعه هوش مصنوعی

تویی که کلا سه ساله وارد فیلد AI شدی، دیسلایک نده 😂
تو درک نمیکنی، چون ظهور ChatGPT باعث شد تازه بفهمی AI چیه و علاقه مند شی بهش

🤣31👍19👎7👌1

1.59K views21:17

Silicon Brain | جامعه هوش مصنوعی

بعد پست‌های بالا، رفتم اینستا اولین پستی که اومد این بود
لاشیا دارن همه چیو رصد میکنن😂

🤣34👍8❤1

1.52K views22:17

Silicon Brain | جامعه هوش مصنوعی

آنتروپیک یه گزارش جدید منتشر کرده که می‌گه مدل جدیدش یعنی Mythos Preview داره به سطحی می‌رسه که شاید تو آینده بتونه به ساخت نسخه‌های بعدی AI کمک کنه

هر نسخه از Claude رو با یه تست ثابت می‌سنجن: به مدل یه کد آموزش AI می‌دن و ازش می‌خوان سرعتش رو بیشتر کنه. Claude Opus 4 تونسته بود 3x speedup بده، ولی Mythos Preview این عدد رو به 52x رسونده.
یه آمار جالب دیگه اینه که الان بیشتر از 80٪ کدهایی که وارد production داخل Anthropic می‌شن، توسط خود Claude نوشته می‌شن، نه انسان‌ها.

توی آزمایش‌های تحقیقاتی هم وقتی به مدل sessionهایی رو نشون دادن که انسان‌ها مسیر اشتباه رفته بودن، Mythos Preview تو 64٪ مواقع قدم بعدی بهتری پیشنهاد داده؛ این عدد شش ماه قبل حدود 51٪ بوده.
از اون طرف مدت زمانی که AI می‌تونه مستقل کار کنه هم داره سریع زیاد می‌شه؛ Opus 3 حدود ۴ دقیقه task مستقل انجام می‌داد، ولی Opus 4.6 الان تا حدود ۱۲ ساعت بدون دخالت انسان کار می‌کنه.
لینک
@silicon_brain | از هوش مصنوعی عقب نمانید

👍14❤3🔥1😱1

1.44K views14:02

Silicon Brain | جامعه هوش مصنوعی

میتونین با انواع مدل های قدرتمند متنی و تصویری
🔹 OpenAI
🔹 Anthropic
🔹 Google
از طریق پلتفرم ژرف کار کنین و مصرف هر مدل رو مدیریت کنین
chat.zharph.com

👍4❤2👎1

1.05K viewsedited 09:30

Silicon Brain | جامعه هوش مصنوعی

دستورات Claude

اگه به Claude دسترسی ندارین میتونین از طریق پلتفرم ژرف باهاش کار کنین

chat.zharph.com

🤣13👍7

1.14K views09:49

Silicon Brain | جامعه هوش مصنوعی

جدیدا OpenAI راهنمای prompting برای GPT-5.5 رو منتشر کرده و پیام اصلیش اینه که کمتر توضیح بده، نتیجه بهتر بگیر

برخلاف نسل‌های قبلی، توی GPT-5.5 معمولاً پرامپت‌های کوتاه‌تر و outcome-first بهتر جواب می‌دن. یعنی به‌جای اینکه مرحله‌به‌مرحله به مدل بگی چیکار کنه، فقط بگو خروجی خوب چه شکلیه، چه محدودیت‌هایی داری، چه اطلاعاتی موجوده و جواب نهایی باید شامل چی باشه.
یه تغییر مهم دیگه اینه که قبل از رفتن سراغ high reasoning effort، بهتره دوباره low و medium effort رو تست کنی چون مدل توی reasoning بهینه‌تر شده و خیلی وقت‌ها بدون مصرف محاسبات بیشتر هم نتیجه خوب می‌ده.

برای workflowهایی که ابزار زیاد دارن (tool-heavy workflows) هنوز چیزهایی مثل preamble، مدیریت phase و assistant-item replay مهم باقی موندن.

همچنین OpenAI پیشنهاد می‌کنه برای ساخت تجربه بهتر توی agentic UX و محصول‌های کاربرمحور، مواردی مثل personality، محدودیت retrieval budget و قوانین validation رو واضح مشخص کنی.

خلاصه اینکه توی GPT-5.5 به‌جای اینکه مسیر حل مسئله رو کامل دیکته کنی، بهتره فقط هدف، محدودیت‌ها و خروجی موردنظر رو مشخص کنی و اجازه بدی مدل خودش مسیر بهینه رو پیدا کنه

این می‌تونه کم‌کم آغازی برای پایان مفاهیمی مثل prompt engineering باشه
لینک
@silicon_brain I از هوش مصنوعی عقب نمانید

👍7❤2

1.27K viewsedited 18:08

About

Blog

Apps

Platform