دستاوردهای یادگیری عمیق(InTec)

عجب مدلی؛ لذت بردم برای ۲۷ میلیارد پارامتر.

deepseek-ai/deepseek-vl2

huggingface.co

deepseek-ai/deepseek-vl2 · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤30

5.49K views16:58

دستاوردهای یادگیری عمیق(InTec)

Forwarded from RandRng

با صحبت امروز پزشکیان
من روی دلار ۱۱۰,۰۰۰ تومان دارم می‌بندم.

آخر سال تمام قراردادهای همکاری داخلیم تموم می‌شه و دستمزد جدید رو بر این اساس می‌گیرم، البته که دارم فرض می‌کنم دلار تا چندروز آینده به ۱۰۰,۰۰۰ تومان برسه و مدتی همین حوالی باشه‌.

اگر دلار واقعاً به ۱۱۰,۰۰۰ تومان برسه (که اصلاً بعید نیست)
قراردادهای سال بعدی رو روی دلار ۱۳۰,۰۰۰ تومان می‌بندم.

به ۲ دلیل این رو میگم:

۱- بچه‌های سنیور گفتند چطوری دستمزد بدیم برای سال بعد.

۲- چند نفر دعوت به همکاری کردن، گفتم حدود دستمزد رو بدوند که وقت هم رو نگیریم.

دستمزد فعلی رو بر اساس دلار ۶۰,۰۰۰ تومان بسته بودم سال قبل که خدا بیامرزش.

👍49❤1

3.68K views16:19

دستاوردهای یادگیری عمیق(InTec)

#ExplainedByScience یک توضیح علمی و منطقی برای تجربیات و اتفاقات غیر منطقی (خطاهای کامپیوتری) خیلی جوانتر که بودم (زمانی که توی کار شبکه بودم) یک بحثی داشتیم راجب اینکه چرا دیتا سنتر رو به ارتفاعات منتقل نکنیم (مشکل شدید گرما، کابل‌کشی و ... داشتیم و این…

از کانال یوتیوب Veritasium تا حالا خیلی نوشتم؛ ولی واقعا از تمام ویدئوهای این کانال لذت می‌برم.

اینبار بررسی دستاوردهای AlphaFold چطور به این ایده رسیدن؛ چطور راهکار براش پیشنهاد شد و چرا جایزه نوبل بهشون دادند ؟

توجه شمارو جلب می‌کنم به میزان سال‌های تحقیق و هزینه‌های تیم DeepMind برای رسیدن به این خروجی.

What if all the world's biggest problems have the same solution?

YouTube

AlphaFold - The Most Useful Thing AI Has Ever Done

The biggest problems in the world might be solved by tiny molecules unlocked using AI. Take your big idea online today with https://ve42.co/hostinger - code VE at checkout.

A huge thank you to John Jumper and Kathryn Tunyasuvunakool at Google Deepmind; and…

❤21👍13

5.67K views20:19

دستاوردهای یادگیری عمیق(InTec)

یک مدل دیگه از دل چین؛ من برای توسعه کدهای Rust بهش رسیدم و تقریبا از ۲-۳ ساعت پیش دارم ازش استفاده می‌کنم:

توی جواب‌های اولیه به مراتب عملکرد بهتری از Chatgpt داره و بر خلاف Deepseek زمان زیادی برای think نیاز نداره و با همه اینا جواباش از هر دو بهتر هست.
دیتاهاش به مراتب آپدیت‌تر هست؛ حداقل توی Rust اینطوریه؛ تا جایی که فکر می‌کنم حتما قابلیت search داره ولی خب جواباش خیلی سریع بر می‌گرده.

تستش کنید:
KIMI
بازم می‌گم چین و آمریکا و فرانسه نداره دیتاهای مهم رو برای این مدل‌ها نفرستید.

Kimi

Kimi AI - Kimi K2 Thinking is here

Try Kimi, your all-in-one AI assistant - now with K2 Thinking, the best open-source reasoning model. Solves math & logic step-by-step, searches accurately, writes & codes with structure, with creativity and precision.

👍51

5.39K views15:40

دستاوردهای یادگیری عمیق(InTec)

دیدم بعضی مدیرای ایرانی می‌گن ماهم کار DeepSeek رو بکنیم روی مدل‌های کوچکتر که با هزینه کمتر تموم بشه ولی مدل فارسی داشته باشیم؛ گفتم چندتا مورد رو بگم :

۱- مدل پایه Deepseek, براساس Llama3.1, Qwen2.5 هست که هزینه کمی نداشته آماده کردنش و توی فارسی هم عالی نیستند.

۲- تیم Deepseek حداقل ۲ سال هست که دارند روی موضوعات AI تحقیق می‌کنند.

۳- این تیم به بیش از 50هزار GPU دسترسی دارند (حداقل A100 80Gig)

۴- مدل بزرگ این شرکت (چیزی که اجرا هست) نیاز به DGX H100 برای اجرا داره؛ اونم در حد تعداد محدود برای response.

باقیش هم هیچی.
خلاصه که قبل از حرف زدن، فکر کنید.

👍100❤12

6.53K views09:57

دستاوردهای یادگیری عمیق(InTec)

به لطف ۴۶ سال حضور آخوندای حرومزاده
دیگه حتی تهران - پایتخت ایران هم امن نیست

#امیرمحمد_خالقی دانشجوی ۱۹ ساله دانشگاه تهران

امنیت هم نداریم، گوه نخورید.

👍187❤35

6.64K viewsedited 19:15

دستاوردهای یادگیری عمیق(InTec)

به لطف ۴۶ سال حضور آخوندای حرومزاده دیگه حتی تهران - پایتخت ایران هم امن نیست #امیرمحمد_خالقی دانشجوی ۱۹ ساله دانشگاه تهران امنیت هم نداریم، گوه نخورید.

برای عزیزان دانشجو

فضای بسته دانشگاه (اطلاعات، هویت و ... شما دستشون هست) واقعاً جای اعتراض نیست.
نگذارید اتفاق ۱۴۰۱ دانشگاه شریف تکرار بشه.

حتی به وقت اعتراض، سلامت شما مهمترین موضوع هست، خواهش می‌کنم توی فضای بسته اعتراض نکنید.

این روزها به همه‌ی ما سخت می‌گذره.

سلامت باشید 🌹🙏

❤115👍38

6.25K viewsedited 21:12

دستاوردهای یادگیری عمیق(InTec)

لیست رنج سنی افرادی که کمک‌های مالی بیمه‌ای دریافت می‌کنند.

این لیست توسط دپارتمان DOGE:
Department Of Government Efficiency

منتشر شده، و شما شاهد این موضوع هستید که نزدیک به ۲۰ میلیون بالای ۱۰۰ سال وجود داره و حتی
۱ نفر بالای ۲۴۰ سال
۱ نفر هم بالای ۳۶۰ سال

اهمیت داده و وجود دپارتمان‌های نظارتی (البته تو ایران ناظر هم زیر دسته ولی خب)

👍39❤4

5.89K views20:01

دستاوردهای یادگیری عمیق(InTec)

چند روز قبل Elon Musk یک توییت زد که، Grok-3 بهترین AI ایی خواد بود که دیدید.

همینطوری که ملت در حالی خوشگذرانی با Gemini 2.0 Flash Thinking بودند (اتفاقاً خیلی از شرکت‌ها هم رفتند سراغش بخصوص اونایی که در زمینه RAG کار می‌کنند)

نسخه Early Release مدل Grok-3 منتشر شد، و رتبه اول رو تا اینجا کار به خودش اختصاص داده
توی اکثر بنچمارک‌های معروف مثل lmarena حتی اختلاف با مدل دوم حدود 20 امتیاز هست.

نظر کاربرا راجب این مدل هم بسیار مثبت هست.

پی‌نوشت‌: توی تمام زمینه‌های lmarena رتبه اول رو داره این مدل (یادم رفت بگم)

👍64❤3

6.16K viewsedited 11:55

دستاوردهای یادگیری عمیق(InTec)

Claude Sonnet 3.7
رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها

حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن.
فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد.

اگر دسترسی دارید حتماً قابلیت برنامه‌نویسی‌اش رو تست کنید و لذت ببرید.

این پست و پست بعدیش رو هم بخونید؛ من حداقل ۲ سال هست که به نیروهای جونیور دارم هشدار می‌دم:

https://xn--r1a.website/pyHints/726

👍32❤4

6.05K viewsedited 10:29

دستاوردهای یادگیری عمیق(InTec)

Claude Sonnet 3.7 رو داشتیم با یکی از همکارا تست می‌کردیم؛ اگر نگم برنامه‌نویس‌ها حداقلش دیگه کدرها کارشون ۱۰۰٪ سخت خواهد بود برای شغل پیدا کردن. فقط کافیه ۴ ماه صبر کنیم تا open source ایده رو پیاده‌سازی کنه و دیگه کسی coder استخدام نخواهد کرد. اگر دسترسی…

چون زیاد سوال شد، زدید که دیگه سراغ این شغل نیایم یعنی ؟

جواب :
خیر منظور من این نبود، منظور اینه که باید درست یاد بگیرید.
کدر شدن : یعنی سینتکس زبانی رو بلد بودن
دولوپر شدن : یعنی جزییات اجرای کد و ... رو هم بدونید اینکه اون زیر داره چه اتفاقاتی میوفته

بر خلاف قدیم که آدما از هر رشته و با هر پس زمینه و توی هر سنی اگر یک مقدار وقت و انرژی می‌ذاشتند وارد دنیای برنامه‌نویسی می‌شدند و با ۲ سال کار کردن و حفظ کردن (فهمیدن فرق داره) یک سری مطالب و استاندارد ها می‌تونستند خودشون رو حتی مدیور جا بزنند.

الان اوضاع فرق کرده، الان یک بچه ۱۲-۱۳ ساله می‌تونه بدون سواد برنامه‌نویسی شروع کنه کار کردن:
بصورت فیلم‌‌وار چند تا آموزش پایتون رو ببینه.
بعد هم شروع کنه به LLM ها درخواست دادن برای کد نویسی.

اکانت Andrej Karpathy (خداوندگار مهندسی و هوش مصنوعی) رو هم اگر دنبال کنید چندروز قبل و بعد از پست من به این موضوع اشاره کردند.

خوشتون بیاد یا نه، دیگه باید مفاهیم رو یاد بگیرید؛ این موج توی ایران دیرتر شروع خواهد شد ولی قطعاً شروع می‌شه.
بسیاری از شرکت‌ها درحال کوچیک شدن هستند، داخل استارتاپ‌های ایرانی که این موج شروع شده.

👍74❤1

5.07K viewsedited 10:49

دستاوردهای یادگیری عمیق(InTec)

Forwarded from Python Hints

این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه:

یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام زده (شخصا اضافه کنم: بله Grok توی این موارد از Sonnet 3.7 هم بهتره) ۸۰٪ رو همون بار اول درست زده ۲۰٪ رو مجبور شدم چندبار باهاش چک کنم؛ حالا هر Javascript, React, Vue, ... دولوپری که دوس داره یک سر به لینک این بزنه و بگه توی ۳ ساعت بدون کمک هیچکدوم از LLM/AI ها چندساعت طول می‌کشه این بازی رو بنویسه ؟

تعداد هواپیماهای قرمزی که می‌بینید؛ باقی کاربرهای داخل بازی هستند (فکر کنم چند میلیون باشه) این توییت X رو کامل بهم ریخته.

https://fly.pieter.com

بعد فرض کنید یک سنیور بازی نویسی + AI خودش یک ارتش چند نفره بازی نویسی خواهد بود ؟
فکر کنم باید زمانبندی قبلیم برای حذف کدرها (کسانی که مفاهیم رو درک نکردند) رو نصف کنم.

پ.ن: بخش درآمدزایی رو هم طرف اضافه کرده ۲۹ دلار برای پرواز با F16 و پشتیبانی از پروژه.

👍37❤8

3.57K views19:52

دستاوردهای یادگیری عمیق(InTec)

همزمان با Sonnet 3.7 پروژه qwen هم از مدل
QwQ Max Preview
رونمایی کرده که‌ خب توی خبرها گم شده بود، من امروز دیدم و رفتم سراغش چون Sonnet 3.7 رو با پروژه چک کردم، برای این هم همینکار رو کردم؛ ۶ تا فیچر باید به پروژه‌ای که دارم اضافه می‌شد که خب فکر می‌کردیم هرکدوم ۱ روز زمان ببره حداقل (بیس کدها خوب چیده شده) ولی امروز از وقت استفاده کردم و اومدم با همین پروژه تست کردم؛ حدوداً ۴ ساعت گذشته و من ۲ فیچر رو به کمک این مدل با تمام تست‌هاش پیاده کردم.
و باید بگم واقعاً عملکرد خیلی خفنی داره:

این پروژه کاملاً رایگان هست و rate limit هم نداره؛ بعد از اتمام preview قرار هست بصورت open source / open weight هم منتشر بشه.

https://chat.qwenlm.ai/

chat.qwen.ai

Qwen Chat

Qwen Chat offers comprehensive functionality spanning chatbot, image and video understanding, image generation, document processing, web search integration, tool utilization, and artifacts.

👍38❤9

4.69K views12:01

دستاوردهای یادگیری عمیق(InTec)

Deep Dive with Andrej Karpathy

How to use LLMs with Andrej Karpathy

یازم تکرار می‌کنم؛ این ویدئوها برای تازه‌کارها بسیار بسیار مناسب هست.

YouTube

How I use LLMs

The example-driven, practical walkthrough of Large Language Models and their growing list of related features, as a new entry to my general audience series on LLMs. In this more practical followup, I take you through the many ways I use LLMs in my own life.…

👍25❤2

5.1K views23:35

دستاوردهای یادگیری عمیق(InTec)

Python Hints

این موضوع خیلی‌هارو سوزوند و یک سری هم خیلی منطقی گفتند که باور ندارند همیچین اتفاقی شدنی باشه: یک نفر توی توییتر به اسم levelsio یک توییتی زده و گفته که آقا من تو عمرم بازی نویسی انجام ندادم ولی یک شبیه‌ساز پرواز توی ۳ ساعت درست کردم و ۱۰۰٪ کد رو Grok3 برام…

این تصویر مربوط هست به بنچمارک Sonnet 3.7

SWE-bench verified

این بنچمارک مجموعه‌ای از درخواست پروژه‌هایی هست که روی سایت‌های مختلف freelance توی سال‌های قبل گذاشته شده (برخلاف خیلی بنچمارک‌های دیگه Synthetic نیست یعنی)

مدل sonnet تونست 62.3% درخواست‌های که نیازمند software engineer بوده رو تسک‌هاش رو کامل انجام بده و با کمی بهبود پرامپت این عدد به 70.3% رسیده.

حالا فرض کنید این ابزار دست شما باشه + خودتون هم سواد مهندسی رو داشته باشید.
بنظرتون این عدد به چند میرسه ؟

👍30❤8

8.2K views11:38

دستاوردهای یادگیری عمیق(InTec)

خیلی سوال شده که آیا خرید cursor, sonnet 3.7 , ... گزینه خوبی هست یا نه؛ بخصوص اینکه مبلغش برای خیلی از بچه‌ها ممکنه زیاد باشند مخصوصا وقتی نمی‌دونید چه کمکی می‌کنه بهتون یا اصلا مفید هست برای شما یا نه

شخصا هیچکدوم رو ندارم و یک کد برای خودم خیلی قبلتر توسعه دادم که از همون استفاده می‌کنم (اینجا جاش نیست) ولی Gemini Code Assist برای استفاده شخصی هم رایگان شده هم محدودیت‌هاش انقدر کم شده که شاید اصن نیاز به پرداخت هم نشه؛ نسخه شخصی حتی نیاز به credit card , ... هم نداره البته

Gemini Code Assist for individual developers available at no cost, with no credit card required.

می‌تونید به راحتی روی vsdcode, jetbrain , ... هم extension اش رو فعال کنید.

Gemini for IDE

شخصا هنوز از اسکریپتهای خودم استفاده می‌کنم ولی حتما تست خواهم کرد این مورد رو هم.

پینوشت:

اگر این کار شمارو راه انداخت؛ قطعا cursor, sonnet3.5 خیلی بهتون کمک می‌کنه؛ اگر اشتباه نکنم خود پروژه cursor هم ۳۰ روز اول رایگان هست.

Google Cloud

Gemini Code Assist | AI coding assistant

Get AI coding and programming help no matter the language or platform with Gemini Code Assist from Google.

👍24❤9

4.8K viewsedited 14:01

دستاوردهای یادگیری عمیق(InTec)

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

این ویدئو رو دیدید ؟
قطعاً، دیدید.
با این داستان پخش شده که ای وای دوتا AI تصمیم گرفتند یک زبان جدید و بهینه برای خودشون استفاده کنند.

اولین باری که دیدم خندیدم و گفتم، چه فکر مریضی (اونی که درست کرده)

بعد دیدم کلی آدم خیلی جدی دارند ازش تعریف می‌کنند، بخصوص مثلاً متخصص‌های هوش مصنوعی.
خیلی ازین آدما، سنیور هستند مثلاً ولی اگر این سوال مصاحبه بود من درجا طرف رو حذف می‌کردم چون قطعاً چیزی از AI نفهمیده.

اخطار:
اگر پستی در مورد این ویدیو گذاشتید سریعاً پاک کنید، آبروتون نره.

حالا استدلال این داستان چیه ؟
پست بعدی رو بخونید.

👍44❤4

3.62K views16:27

دستاوردهای یادگیری عمیق(InTec)

فقط کافیه ۱ ساعت راجب LLM ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلی‌ها نفهمیدن.
با اینکه ML Researcher / Engineer هستند مثلاً.
من خیلی ساده میگم، که اینا هم بفهمند :

۱- همه‌ی ما می‌دونیم LLM چیزی نیست جز یک مدل احتمالاتی که یاد میگیره بر اساس آنچه در اینترنت از متن‌ها دیده به ترکیب کنار هم قرار گرفتن کلمات عددی بین 0-1 بده، و بر اساس این اعداد کلمه بعدی رو پیش‌بینی کنه.

یعنی اگر یک مدل مطالب زیادی در مور‌د "کامپیوتر صنعتی" دیده باشه، وقتی شما کلمه "کامپیوتر" رو بهش بدید احتمال زیادی (عددی نزدیک به ۱) می‌ده که کلمه بعدی "صنعتی" باشه.

خب حالا با این وضعیت، چنین مدلی می‌تونه beep رو ایجاد کنه و بفهمه ؟

۲- این مدل‌ها برای درک زبان در طول زمان آموزش، شروع به ساخت یک فضای برداری می‌کنند که هر کلمه رو به یک بردار عددی تبدیل می‌کنه اصطلاحاً بهش می‌گیم Embedding و این یعنی فرض کنید یک دیکشنری به شما داده بشه و بگم همه کلمات دنیا توی این دیکشنری هست (مدل‌ها خلاقیت ندارند، پس این فرض رو داشته باشید) چطور شما می‌تونید از کلمات داخل دیکشنری محدود به beep برسید ؟!

۳- فرض کنید یک مدل اتفاقاً beep رو هم آموزش دیده، یعنی شما علاوه بر اون دیکشنری کلمات دنیا یک دیکشنری خاص هم بهتون داده شده برای تبدیل آوا و صدای beep به متن (مثل کد مورس)
شما می‌تونید کد مورس بزنید ولی وقتی دیکشنری رو کس دیگری نداره چطور می‌تونه با شما ارتباط برقرار کنه ؟

پس حتماً باید هر ۲ مدل روی صدای beep علاوه بر متن‌های اینترنت آموزش دیده باشند.
پس اینکه خودشون به این زبان رسیده باشه، دروغ محض هست و از فیلم‌های دهه ۸۰-۹۰ میلادی هالیوود میاد.

ولی حتی مورد آموزش دیدن روی beep هم در کار نیست و این رو فقط باید برنامه‌نویس باشید تا بفهمید (نیازی به سواد هوش مصنوعی هم ندارد حتی فهمیدنش)

ابتدای ویدئو هر ۲ مدل، به انگلیسی صحبت می‌کنند که طبیعی هست و هیچ ایرادی ندارد؛ اما بعد مدل دوم پیشنهاد استفاده از زبان مشترک و بهینه رو میده و ادعا شده این زبان ساخت خودشون هست.

۱- پس آدمی که فیلم گرفته نمی‌توانسته بفهمه صحبت بین اینها چی هست.
همون‌طور که شما اگر فرانسه ٫ آلمانی تمرین نکرده باشی نخواهی فهمید گفتگو بین دو نفر چه معنایی داره

۲- کدهای فرانت ٫ اپلیکیشن هر ۲ مدل تا قبل از سوییچ شدن زبان هیچ متنی رو چاپ نمی‌کردند، چرا یک دفعه سورس کد آپدیت شد و شروع به چاپ متن‌ها توی زبان جدید کرد ؟!

۳- اگر beep بهینه‌تر هست، که از نظر محاسبات یک مدل همچین چیزی رو می‌گه، چرا مدل باید زحمت تولید متن به انگلیسی رو هم همزمان بکشه ؟

۴- چرا مدل تبدیل متن به گفتار یکباره، علاوه بر خروجی باید ورودیش رو هم توی خروجی ارسال کنه و چرا خروجی‌ مدل تبدیل به گفتار و متن شد به یکباره ؟

آقا٫خانم مثلاً متخصص، یکم نحوه عملکرد مدل‌هایی که زدی توش تخصص داری رو بخون حداقل.
من این پست رو تو صفحه کسی دیدم که توی پست‌های مختلف؛ خودش رو متخصص LLM ها و البته جزو سازنده های برترین LLM های فارسی معرفی کرده بود، از بد روزگار کلی اسکل تر از خودشم ازش بابت پست خوبش تشکر کرده بودن.

واقعاً چی می‌کشیم از دست این جماعت

👍105❤11

4.36K viewsedited 16:53

دستاوردهای یادگیری عمیق(InTec)

فقط کافیه ۱ ساعت راجب LLM ها خونده باشید تا با منطق ثابت کنید این ویدئو کاملاً تقلب هست ولی خب خیلی‌ها نفهمیدن. با اینکه ML Researcher / Engineer هستند مثلاً. من خیلی ساده میگم، که اینا هم بفهمند : ۱- همه‌ی ما می‌دونیم LLM چیزی نیست جز یک مدل احتمالاتی که…

چون این رو خیلی‌ها فرستادید.

لذت می‌برم می‌بینم اعضای کانال همه حرفه‌ای و با دقت هستند، دمتون گرم آدم امیدوار می‌شه.

Github

GitHub

GitHub - ggerganov/ggwave: Tiny data-over-sound library

Tiny data-over-sound library. Contribute to ggerganov/ggwave development by creating an account on GitHub.

❤22👍4

3.63K views07:46

دستاوردهای یادگیری عمیق(InTec)

Forwarded from Python Hints

ابزار تقلب توی مصاحبه :

Interview Coder AI tool

این ابزار کاملاً open source هم هست، حالا چرا اینجا گذاشتم ؟
نه برای اینکه تقلب کنید (چون درجا گیر میوفتید اگر طرف کار بلد باشه)
برای این هست که فوق‌العاده میشه ازش برای آمادگی مصاحبه فنی استفاده کرد؛ اینکه چی بگید رو هم براتون می‌ذاره.

بخصوص بدرد مرحله اول و دوم مصاحبه که کد زدن و الگوریتم و ... داره می‌خوره

GitHub

GitHub - ibttf/interview-coder: An invisible desktop application to help you pass your technical interviews.

An invisible desktop application to help you pass your technical interviews. - ibttf/interview-coder

👍27❤8

2.96K views13:17

دستاوردهای یادگیری عمیق(InTec)

#Quick

چون هزینه دوره‌های prompt engineering رو برام فرستادید و گفتید ارزش رفتن داره :

پاسخ کوتاه : خیر به هیچ وجه (مخاطب‌های کانال)

پاسخ بلند : بیش از ۹۰٪ شما قطعاً برنامه‌نویس هستید با markdown هم آشنایی دارید (readme پروژه رو github رو می‌نویسید) بجای وقت گذاشتن روی حفظ کردن prompt engineering, ... نگاهی به دیتاست‌هایی که مدل هوش مصنوعی روش آموزش دیده بندازید و بر اساس پترن اونها بهش پرامپت بدید.

بهترین نتایج رو خواهید گرفت.

راه ساده‌تر، این راه همیشه جواب نیست ولی خب؛ برای مدل‌هایی که از یک مدل بزرگتر آموزش دیدند (distillation, synthétique data, ....) می‌تونید از مدل بزرگتر بخواهید که یک پرامپت استاندارد برای متن درخواست شما بنویسه؛ بعد متن رو بهش میدید و پرامپت رو می‌گیرید.

به خوبی روش قبلی نیست ولی نتایجش بسیار عالیه؛ prompt engineering ممکنه ساعت‌ها طول بکشه تا به پرامپت خوب برسه؛ ما تو دقیقه پرامپت بهتر رو می‌زنیم توی تیم خودم.
حداقل تو بیش از ۹۵٪ مواقع.

اگر تست کردید این تکنیک جواب داد و تکنیک رو دوست داشتید.
متن رو با منبع به اشتراک بذارید؛ شاید بیشتر از این تجربیات مخصوص تیم خودم رو به اشتراک گذاشتم.

👍49❤12

4.09K views09:43

About

Blog

Apps

Platform