دستاوردهای یادگیری عمیق(InTec)
9.47K subscribers
362 photos
40 videos
44 files
673 links
هوش مصنوعی، یادگیری ماشین و یادگیری عمیق
موضوع اصلی کانال

این یک بلاگ شخصی با طرز تفکر شخصی هست.

Core Python : @PyHints

تلاشی هم در یادگیری Rust دارم که درحال داکیومنت شدن هم هست؛ اگر شماهم به این زبان علاقمند هستید join یادتون نره

Rust: @PyRust
Download Telegram
Forwarded from RandRng
با صحبت امروز پزشکیان
من روی دلار ۱۱۰,۰۰۰ تومان دارم می‌بندم.

آخر سال تمام قراردادهای همکاری داخلیم تموم می‌شه و دستمزد جدید رو بر این اساس می‌گیرم، البته که دارم فرض می‌کنم دلار تا چندروز آینده به ۱۰۰,۰۰۰ تومان برسه و مدتی همین حوالی باشه‌.

اگر دلار واقعاً به ۱۱۰,۰۰۰ تومان برسه (که اصلاً بعید نیست)
قراردادهای سال بعدی رو روی دلار ۱۳۰,۰۰۰ تومان می‌بندم.

به ۲ دلیل این رو میگم:

۱- بچه‌های سنیور گفتند چطوری دستمزد بدیم برای سال بعد.

۲- چند نفر دعوت به همکاری کردن، گفتم حدود دستمزد رو بدوند که وقت هم رو نگیریم.

دستمزد فعلی رو بر اساس دلار ۶۰,۰۰۰ تومان بسته بودم سال قبل که خدا بیامرزش.
👍491
یک مدل دیگه از دل چین؛ من برای توسعه کدهای Rust بهش رسیدم و تقریبا از ۲-۳ ساعت پیش دارم ازش استفاده می‌کنم:

توی جواب‌های اولیه به مراتب عملکرد بهتری از Chatgpt داره و بر خلاف Deepseek زمان زیادی برای think نیاز نداره و با همه اینا جواباش از هر دو بهتر هست.
دیتاهاش به مراتب آپدیت‌تر هست؛ حداقل توی Rust اینطوریه؛ تا جایی که فکر می‌کنم حتما قابلیت search داره ولی خب جواباش خیلی سریع بر می‌گرده.

تستش کنید:
KIMI
بازم می‌گم چین و آمریکا و فرانسه نداره دیتاهای مهم رو برای این مدل‌ها نفرستید.
👍51
دیدم بعضی مدیرای ایرانی می‌گن ماهم کار DeepSeek رو بکنیم روی مدل‌های کوچکتر که با هزینه کمتر تموم بشه ولی مدل فارسی داشته باشیم؛ گفتم چندتا مورد رو بگم :

۱- مدل پایه Deepseek, براساس Llama3.1, Qwen2.5 هست که هزینه کمی نداشته آماده کردنش و توی فارسی هم عالی نیستند.

۲- تیم Deepseek حداقل ۲ سال هست که دارند روی موضوعات AI تحقیق می‌کنند.

۳- این تیم به بیش از 50هزار GPU دسترسی دارند (حداقل A100 80Gig)

۴- مدل بزرگ این شرکت (چیزی که اجرا هست) نیاز به DGX H100 برای اجرا داره؛ اونم در حد تعداد محدود برای response.

باقیش هم هیچی.
خلاصه که قبل از حرف زدن، فکر کنید.
👍10012
به لطف ۴۶ سال حضور آخوندای حرومزاده
دیگه حتی تهران - پایتخت ایران هم امن نیست

#امیرمحمد_خالقی دانشجوی ۱۹ ساله دانشگاه تهران

امنیت هم نداریم، گوه نخورید.
👍18735
دستاوردهای یادگیری عمیق(InTec)
به لطف ۴۶ سال حضور آخوندای حرومزاده دیگه حتی تهران - پایتخت ایران هم امن نیست #امیرمحمد_خالقی دانشجوی ۱۹ ساله دانشگاه تهران امنیت هم نداریم، گوه نخورید.
برای عزیزان دانشجو

فضای بسته دانشگاه (اطلاعات، هویت و ... شما دستشون هست) واقعاً جای اعتراض نیست.
نگذارید اتفاق ۱۴۰۱ دانشگاه شریف تکرار بشه.

حتی به وقت اعتراض، سلامت شما مهمترین موضوع هست، خواهش می‌کنم توی فضای بسته اعتراض نکنید.

این روزها به همه‌ی ما سخت می‌گذره.

سلامت باشید 🌹🙏
115👍38
لیست رنج سنی افرادی که کمک‌های مالی بیمه‌ای دریافت می‌کنند.

این لیست توسط دپارتمان DOGE:
Department Of Government Efficiency

منتشر شده، و شما شاهد این موضوع هستید که نزدیک به ۲۰ میلیون بالای ۱۰۰ سال وجود داره و حتی
۱ نفر بالای ۲۴۰ سال
۱ نفر هم بالای ۳۶۰ سال

اهمیت داده و وجود دپارتمان‌های نظارتی (البته تو ایران ناظر هم زیر دسته ولی خب)
👍394
چند روز قبل Elon Musk یک توییت زد که، Grok-3 بهترین AI ایی خواد بود که دیدید.

همینطوری که ملت در حالی خوشگذرانی با Gemini 2.0 Flash Thinking بودند (اتفاقاً خیلی از شرکت‌ها هم رفتند سراغش بخصوص اونایی که در زمینه RAG کار می‌کنند)

نسخه Early Release مدل Grok-3 منتشر شد، و رتبه اول رو تا اینجا کار به خودش اختصاص داده
توی اکثر بنچمارک‌های معروف مثل lmarena حتی اختلاف با مدل دوم حدود 20 امتیاز هست.

نظر کاربرا راجب این مدل هم بسیار مثبت هست.


پی‌نوشت‌: توی تمام زمینه‌های lmarena رتبه اول رو داره این مدل (یادم رفت بگم)
👍643
Claude Sonnet 3.7
رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها

حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن.
فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد.

اگر دسترسی دارید حتماً قابلیت برنامه‌نویسی‌اش رو تست کنید و لذت ببرید.

این پست و پست بعدیش رو هم بخونید؛ من حداقل ۲ سال هست که به نیروهای جونیور دارم هشدار می‌دم:

https://xn--r1a.website/pyHints/726
👍324
دستاوردهای یادگیری عمیق(InTec)
Claude Sonnet 3.7 رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن. فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد. اگر دسترسی…
چون زیاد سوال شد، زدید که دیگه سراغ این شغل نیایم یعنی ؟

جواب :
خیر منظور من این نبود، منظور اینه که باید درست یاد بگیرید.
کدر شدن : یعنی سینتکس زبانی رو بلد بودن
دولوپر شدن : یعنی جزییات اجرای کد و ... رو هم بدونید اینکه اون زیر داره چه اتفاقاتی میوفته

بر خلاف قدیم که آدما از هر رشته و با هر پس زمینه و توی هر سنی اگر یک مقدار وقت و انرژی می‌ذاشتند وارد دنیای برنامه‌نویسی می‌شدند و با ۲ سال کار کردن و حفظ کردن (فهمیدن فرق داره) یک سری مطالب و استاندارد ها می‌تونستند خودشون رو حتی مدیور جا بزنند.

الان اوضاع فرق کرده، الان یک بچه ۱۲-۱۳ ساله می‌تونه بدون سواد برنامه‌نویسی شروع کنه کار کردن:
بصورت فیلم‌‌وار چند تا آموزش پایتون رو ببینه.
بعد هم شروع کنه به LLM ها درخواست دادن برای کد نویسی.

اکانت Andrej Karpathy (خداوندگار مهندسی و هوش مصنوعی) رو هم اگر دنبال کنید چندروز قبل و بعد از پست من به این موضوع اشاره کردند.

خوشتون بیاد یا نه، دیگه باید مفاهیم رو یاد بگیرید؛ این موج توی ایران دیرتر شروع خواهد شد ولی قطعاً شروع می‌شه.
بسیاری از شرکت‌ها درحال کوچیک شدن هستند، داخل استارتاپ‌های ایرانی که این موج شروع شده.
👍741
Forwarded from Python Hints
این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه:

یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام زده (شخصا اضافه کنم: بله Grok توی این موارد از Sonnet 3.7 هم بهتره) ۸۰٪ رو همون بار اول درست زده ۲۰٪ رو مجبور شدم چندبار باهاش چک کنم؛ حالا هر Javascript, React, Vue, ... دولوپری که دوس داره یک سر به لینک این بزنه و بگه توی ۳ ساعت بدون کمک هیچکدوم از LLM/AI ها چندساعت طول می‌کشه این بازی رو بنویسه ؟

تعداد هواپیماهای قرمزی که می‌بینید؛ باقی کاربرهای داخل بازی هستند (فکر کنم چند میلیون باشه) این توییت X رو کامل بهم ریخته.

https://fly.pieter.com


بعد فرض کنید یک سنیور بازی نویسی + AI خودش یک ارتش چند نفره بازی نویسی خواهد بود ؟
فکر کنم باید زمانبندی قبلیم برای حذف کدرها (کسانی که مفاهیم رو درک نکردند) رو نصف کنم.

پ.ن: بخش درآمدزایی رو هم طرف اضافه کرده ۲۹ دلار برای پرواز با F16 و پشتیبانی از پروژه.
👍378
همزمان با Sonnet 3.7 پروژه qwen هم از مدل
QwQ Max Preview
رونمایی کرده که‌ خب توی خبرها گم شده بود، من امروز دیدم و رفتم سراغش چون Sonnet 3.7 رو با پروژه چک کردم، برای این هم همینکار رو کردم؛ ۶ تا فیچر باید به پروژه‌ای که دارم اضافه می‌شد که خب فکر می‌کردیم هرکدوم ۱ روز زمان ببره حداقل (بیس کدها خوب چیده شده) ولی امروز از وقت استفاده کردم و اومدم با همین پروژه تست کردم؛ حدوداً ۴ ساعت گذشته و من ۲ فیچر رو به کمک این مدل با تمام تست‌هاش پیاده کردم.
و باید بگم واقعاً عملکرد خیلی خفنی داره:

این پروژه کاملاً رایگان هست و rate limit هم نداره؛ بعد از اتمام preview قرار هست بصورت open source / open weight هم منتشر بشه.

https://chat.qwenlm.ai/
👍389
Python Hints
این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…
این تصویر مربوط هست به بنچمارک Sonnet 3.7

SWE-bench verified


این بنچمارک مجموعه‌ای از درخواست پروژه‌هایی هست که روی سایت‌های مختلف freelance توی سال‌های قبل گذاشته شده (برخلاف خیلی بنچمارک‌های دیگه Synthetic نیست یعنی)

مدل sonnet تونست 62.3% درخواست‌های که نیازمند software engineer بوده رو تسک‌هاش رو کامل انجام بده و با کمی بهبود پرامپت این عدد به 70.3% رسیده.

حالا فرض کنید این ابزار دست شما باشه + خودتون هم سواد مهندسی رو داشته باشید.
بنظرتون این عدد به چند میرسه ؟
👍308
خیلی سوال شده که آیا خرید cursor, sonnet 3.7 , ... گزینه خوبی هست یا نه؛ بخصوص اینکه مبلغش برای خیلی از بچه‌ها ممکنه زیاد باشند مخصوصا وقتی نمی‌دونید چه کمکی می‌کنه بهتون یا اصلا مفید هست برای شما یا نه

شخصا هیچکدوم رو ندارم و یک کد برای خودم خیلی قبلتر توسعه دادم که از همون استفاده می‌کنم (اینجا جاش نیست) ولی Gemini Code Assist برای استفاده شخصی هم رایگان شده هم محدودیت‌هاش انقدر کم شده که شاید اصن نیاز به پرداخت هم نشه؛ نسخه شخصی حتی نیاز به credit card , ... هم نداره البته

Gemini Code Assist for individual developers available at no cost, with no credit card required.


می‌تونید به راحتی روی vsdcode, jetbrain , ... هم extension اش رو فعال کنید.

Gemini for IDE

شخصا هنوز از اسکریپتهای خودم استفاده می‌کنم ولی حتما تست خواهم کرد این مورد رو هم.


پینوشت:

اگر این کار شمارو راه انداخت؛ قطعا cursor, sonnet3.5 خیلی بهتون کمک می‌کنه؛ اگر اشتباه نکنم خود پروژه cursor هم ۳۰ روز اول رایگان هست.
👍249
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو رو دیدید ؟
قطعاً، دیدید.
با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند.

اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده)

بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف می‌کنند، بخصوص مثلاً متخصص‌های هوش مصنوعی.
خیلی ازین آدما، سنیور هستند مثلاً ولی اگر این سوال مصاحبه بود من درجا طرف رو حذف می‌کردم چون قطعاً چیزی از AI نفهمیده.


اخطار:
اگر پستی در مورد این ویدیو گذاشتید سریعاً پاک کنید، آبروتون نره.

حالا استدلال این داستان چیه ؟
پست بعدی رو بخونید.
👍444
دستاوردهای یادگیری عمیق(InTec)
این ویدئو رو دیدید ؟ قطعاً، دیدید. با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند. اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده) بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف می‌کنند،…
فقط کافیه ۱ ساعت راجب LLM ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلی‌ها نفهمیدن.
با اینکه ML Researcher / Engineer هستند مثلاً.
من خیلی ساده میگم، که اینا هم بفهمند :

۱- همه‌ی ما می‌دونیم LLM چیزی نیست جز یک مدل احتمالاتی که یاد میگیره بر اساس آنچه در اینترنت از متن‌ها دیده به ترکیب کنار هم قرار گرفتن کلمات عددی بین 0-1 بده، و بر اساس این اعداد کلمه بعدی رو پیش‌بینی کنه.

یعنی اگر یک مدل مطالب زیادی در مور‌د "کامپیوتر صنعتی" دیده باشه، وقتی شما کلمه "کامپیوتر" رو بهش بدید احتمال زیادی (عددی نزدیک به ۱) می‌ده که کلمه بعدی "صنعتی" باشه.

خب حالا با این وضعیت، چنین مدلی می‌تونه beep رو ایجاد کنه و بفهمه ؟

۲- این مدل‌ها برای درک زبان در طول زمان آموزش، شروع به ساخت یک فضای برداری می‌کنند که هر کلمه رو به یک بردار عددی تبدیل می‌کنه اصطلاحاً بهش می‌گیم Embedding و این یعنی فرض کنید یک دیکشنری به شما داده بشه و بگم همه کلمات دنیا توی این دیکشنری هست (مدل‌ها خلاقیت ندارند، پس این فرض رو داشته باشید) چطور شما می‌تونید از کلمات داخل دیکشنری محدود به beep برسید ؟!

۳- فرض کنید یک مدل اتفاقاً beep رو هم آموزش دیده، یعنی شما علاوه بر اون دیکشنری کلمات دنیا یک دیکشنری خاص هم بهتون داده شده برای تبدیل آوا و صدای beep به متن (مثل کد مورس)
شما می‌تونید کد مورس بزنید ولی وقتی دیکشنری رو کس دیگری نداره چطور می‌تونه با شما ارتباط برقرار کنه ؟

پس حتماً باید هر ۲ مدل روی صدای beep علاوه بر متن‌های اینترنت آموزش دیده باشند.
پس اینکه خودشون به این زبان رسیده باشه، دروغ محض هست و از فیلم‌های دهه ۸۰-۹۰ میلادی هالیوود میاد.

ولی حتی مورد آموزش دیدن روی beep هم در کار نیست و این رو فقط باید برنامه‌نویس باشید تا بفهمید (نیازی به سواد هوش مصنوعی هم ندارد حتی فهمیدنش)

ابتدای ویدئو هر ۲ مدل، به انگلیسی صحبت می‌کنند که طبیعی هست و هیچ ایرادی ندارد؛ اما بعد مدل دوم پیشنهاد استفاده از زبان مشترک و بهینه رو میده و ادعا شده این زبان ساخت خودشون هست.

۱- پس آدمی که فیلم گرفته نمی‌توانسته بفهمه صحبت بین اینها چی هست.
همون‌طور که شما اگر فرانسه ٫ آلمانی تمرین نکرده باشی نخواهی فهمید گفتگو بین دو نفر چه معنایی داره

۲- کدهای فرانت ٫ اپلیکیشن هر ۲ مدل تا قبل از سوییچ شدن زبان هیچ متنی رو چاپ نمی‌کردند، چرا یک دفعه سورس کد آپدیت شد و شروع به چاپ متن‌ها توی زبان جدید کرد ؟!

۳- اگر beep بهینه‌تر هست، که از نظر محاسبات یک مدل همچین چیزی رو می‌گه، چرا مدل باید زحمت تولید متن به انگلیسی رو هم همزمان بکشه ؟

۴- چرا مدل تبدیل متن به گفتار یکباره، علاوه بر خروجی باید ورودیش رو هم توی خروجی ارسال کنه و چرا خروجی‌ مدل تبدیل به گفتار و متن شد به یکباره ؟

آقا٫خانم مثلاً متخصص، یکم نحوه عملکرد مدل‌هایی که زدی توش تخصص داری رو بخون حداقل.
من این پست رو تو صفحه کسی دیدم که توی پست‌های مختلف؛ خودش رو متخصص LLM ها و البته جزو سازنده های برترین LLM های فارسی معرفی کرده بود، از بد روزگار کلی اسکل تر از خودشم ازش بابت پست خوبش تشکر کرده بودن.

واقعاً چی می‌کشیم از دست این جماعت
👍10511
Forwarded from Python Hints
ابزار تقلب توی مصاحبه :

Interview Coder AI tool

این ابزار کاملاً open source هم هست، حالا چرا اینجا گذاشتم ؟
نه برای اینکه تقلب کنید (چون درجا گیر میوفتید اگر طرف کار بلد باشه)
برای این هست که فوق‌العاده میشه ازش برای آمادگی مصاحبه فنی استفاده کرد؛ اینکه چی بگید رو هم براتون می‌ذاره.

بخصوص بدرد مرحله اول و دوم مصاحبه که کد زدن و الگوریتم و ... داره می‌خوره
👍278
#Quick

چون هزینه دوره‌های prompt engineering رو برام فرستادید و گفتید ارزش رفتن داره :

پاسخ کوتاه : خیر به هیچ وجه (مخاطب‌های کانال)

پاسخ بلند : بیش از ۹۰٪ شما قطعاً برنامه‌نویس هستید با markdown هم آشنایی دارید (readme پروژه رو github رو می‌نویسید) بجای وقت گذاشتن روی حفظ کردن prompt engineering, ... نگاهی به دیتاست‌هایی که مدل هوش مصنوعی روش آموزش دیده بندازید و بر اساس پترن اونها بهش پرامپت بدید.

بهترین نتایج رو خواهید گرفت.

راه ساده‌تر، این راه همیشه جواب نیست ولی خب؛ برای مدل‌هایی که از یک مدل بزرگتر آموزش دیدند (distillation, synthétique data, ....) می‌تونید از مدل بزرگتر بخواهید که یک پرامپت استاندارد برای متن درخواست شما بنویسه؛ بعد متن رو بهش میدید و پرامپت رو می‌گیرید.

به خوبی روش قبلی نیست ولی نتایجش بسیار عالیه؛ prompt engineering ممکنه ساعت‌ها طول بکشه تا به پرامپت خوب برسه؛ ما تو دقیقه پرامپت بهتر رو می‌زنیم توی تیم خودم.
حداقل تو بیش از ۹۵٪ مواقع.


اگر تست کردید این تکنیک جواب داد و تکنیک رو دوست داشتید.
متن رو با منبع به اشتراک بذارید؛ شاید بیشتر از این تجربیات مخصوص تیم خودم رو به اشتراک گذاشتم.
👍4912