Data world with Mina pinned «گاهی میبینم دوستانی که تازه وارد مسیر دیتا ساینس میشوند، برای مشاوره و منتورینگ سراغ هر کسی میروند؛ فقط چون خوب حرف میزند، یا محتوای زیادی تولید میکند. اما واقعیت این است که در این حوزه، حرف کافی نیست. تجربه عملیست که شخصیت یک منتور را میسازد. اگر…»
Forwarded from Mohammad Discovery
منم همین چند ساعت پیش متوجه شدم که سایت متمم چند هفته ای هست که فیلتر شده،
برام ناراحت کننده و تاسف آور بود،
همون روزای اول ١٧-١٨ م نگران متمم هم بودم ولی کلا دیگه بعد از قطع اینترنت یادم رفت،
متمم، محل توسعه مهارت های من نیست، محل رشد و توسعه ایران(+فارسی زبانان)هست،
همین چند روز پیش داشتم به سایت هایی مثل متمم فکر می کردم،
متمم چه باشه، چه نباشه، چه فیلتر باشه چه نباشه،
اثر خودش رو توی این کشور گذاشته، جریان فکری رو ایجاد کرد که همیشه زنده می مونه، متمم اون محتوای همیشه سبز نیست، اون نوع نگاه به مفاهیم و مهارت ها و یادگیری بود که جریانش رو ساخت،
کلیدواژه هایی مثل تفکر سیستمی، مدل ذهنی، تصمیم گیری و صدها کلیدواژه دیگه رو معرفی کرد، دقیق تعریف کرد و فهموند.
متمم برای خیلی از ایرانیا که دسترسی به خیلی از امکانات آموزشی و ارتباطی رو نداشتن یه مرجع قدرتمند و با کیفیت بوده و هست،
از متمم دوس دارم بیشتر بنویسم و می نویسم،
دوس داشتم فقط در شروع چند جمله ای گفته باشم.
برام ناراحت کننده و تاسف آور بود،
همون روزای اول ١٧-١٨ م نگران متمم هم بودم ولی کلا دیگه بعد از قطع اینترنت یادم رفت،
متمم، محل توسعه مهارت های من نیست، محل رشد و توسعه ایران(+فارسی زبانان)هست،
همین چند روز پیش داشتم به سایت هایی مثل متمم فکر می کردم،
متمم چه باشه، چه نباشه، چه فیلتر باشه چه نباشه،
اثر خودش رو توی این کشور گذاشته، جریان فکری رو ایجاد کرد که همیشه زنده می مونه، متمم اون محتوای همیشه سبز نیست، اون نوع نگاه به مفاهیم و مهارت ها و یادگیری بود که جریانش رو ساخت،
کلیدواژه هایی مثل تفکر سیستمی، مدل ذهنی، تصمیم گیری و صدها کلیدواژه دیگه رو معرفی کرد، دقیق تعریف کرد و فهموند.
متمم برای خیلی از ایرانیا که دسترسی به خیلی از امکانات آموزشی و ارتباطی رو نداشتن یه مرجع قدرتمند و با کیفیت بوده و هست،
از متمم دوس دارم بیشتر بنویسم و می نویسم،
دوس داشتم فقط در شروع چند جمله ای گفته باشم.
👍16❤11
درود به اعضای کانال 💫
امیدوارم اینترنت داشته باشید و در سلامت پیامم رو ببینید 🥺❤️
ممنون میشم با ری اکشن و ایموجی از خودتون و سالم بودنتون خبر بدید.
تو پیام رسان "بله" کانال زدم که تو شرایط قطعی نت بتونیم باهم در ارتباط باشیم ،گرچه این روزها هممون تاب آوری و بقا رو تمرین میکنیم.
«هوش مصنوعی و یادگیری ماشین»
🆔 شناسه:
https://ble.ir/ai_with_mina
به امید دیدار تو روزهای سپید 💫✌️
امیدوارم اینترنت داشته باشید و در سلامت پیامم رو ببینید 🥺❤️
ممنون میشم با ری اکشن و ایموجی از خودتون و سالم بودنتون خبر بدید.
تو پیام رسان "بله" کانال زدم که تو شرایط قطعی نت بتونیم باهم در ارتباط باشیم ،گرچه این روزها هممون تاب آوری و بقا رو تمرین میکنیم.
«هوش مصنوعی و یادگیری ماشین»
🆔 شناسه:
https://ble.ir/ai_with_mina
به امید دیدار تو روزهای سپید 💫✌️
❤33
اگر هم سوالی، مشاوره ای داشتید میتونید با شماره
09029070835
در ارتباط باشید.
09029070835
در ارتباط باشید.
🙏5
Data world with Mina pinned «درود به اعضای کانال 💫 امیدوارم اینترنت داشته باشید و در سلامت پیامم رو ببینید 🥺❤️ ممنون میشم با ری اکشن و ایموجی از خودتون و سالم بودنتون خبر بدید. تو پیام رسان "بله" کانال زدم که تو شرایط قطعی نت بتونیم باهم در ارتباط باشیم ،گرچه این روزها هممون تاب…»
🔻دسترسی به تعدادی از سایتها و سرویسهای بینالمللی که عموما مورد نیاز توسعهدهندگان و دانشجویان هستند، برقرار شده است.
🔻سایت letsencrypt.org که برای صدور گواهی SSL ضروری است، نیز در دسترس قرار گرفتهاند.
🔻فهرست سایتهایی که دسترسی به آنها میسر شده است:
https://letsencrypt.org/
https://react.dev
https://vercel.com
https://ubuntu.com/
https://nextjs.org
https://www.python.org/
https://link.springer.com
https://pubmed.ncbi.nlm.nih.gov
https://www.digicert.com/
https://www.sciencedirect.com/
https://www.certum.eu/en/
https://sourceforge.net/
https://pypi.org/
https://crates.io
https://www.ieee.org
https://xn--r1a.website/datalook_ir
🔻سایت letsencrypt.org که برای صدور گواهی SSL ضروری است، نیز در دسترس قرار گرفتهاند.
🔻فهرست سایتهایی که دسترسی به آنها میسر شده است:
https://letsencrypt.org/
https://react.dev
https://vercel.com
https://ubuntu.com/
https://nextjs.org
https://www.python.org/
https://link.springer.com
https://pubmed.ncbi.nlm.nih.gov
https://www.digicert.com/
https://www.sciencedirect.com/
https://www.certum.eu/en/
https://sourceforge.net/
https://pypi.org/
https://crates.io
https://www.ieee.org
https://xn--r1a.website/datalook_ir
letsencrypt.org
Let's Encrypt
Let's Encrypt is a free, automated, and open Certificate Authority brought to you by the nonprofit Internet Security Research Group (ISRG). Read all about our nonprofit work this year in our 2025 Annual Report.
❤7
هفت پروژه مهندسی داده بسیار کاربردی (سناریوهای واقعی، نه Kaggle 👇🏻)
۱. پایپلاین API به انبار داده
(API-to-Warehouse Pipeline)
دریافت داده از یک API عمومی (مثل OpenWeather یا Spotify).
مدیریت بارگذاری تدریجی (Incremental Loading) در Postgres.
⚙️ تکنولوژیها: Python، dlt، Postgres، Docker
https://dlthub.com/docs/intro
۲. انبار داده مدرن با dbt
لود کردن دیتاست نمونه Jaffle Shop در Postgres.
ساخت مدلها از لایه staging به marts به همراه تستها، مستندسازی و اسنپشاتهای SCD2.
⚙️ تکنولوژیها: dbt Core، SQL، Postgres، Git
🔗 https://docs.getdbt.com/guides/manual-install
۳. پروژه DAG Airflow با سنسورها و backFills
زمانبندی دریافت روزانه داده از دیتاست شکایات NYC 311.
اضافه کردن سنسورها، شاخهبندی (branching) و تلاش مجدد (retry) با backoff.
⚙️ تکنولوژیها: Apache Airflow، Python، Docker
🔗 آموزش Airflow:
https://airflow.apache.org/docs/apache-airflow/stable/tutorial/
۴. استریم رویداد با Kafka
اجرای Kafka به صورت لوکال و تولید دادههای مصنوعی (مثل کلیک و سفارش) با Python و Faker.
ساخت یک consumer که دادهها را به صورت real-time تجمیع کرده و در Postgres ذخیره کند.
تکنولوژیها: Kafka، Python، Faker، Docker
🔗 مبانی Kafka:
https://developer.confluent.io/courses/apache-kafka/events/
۵. پردازش دستهای با PySpark
(PySpark Batch Processing)
پردازش دادههای یک ماه از GitHub Archive (حدود ۵۰ گیگابایت رویداد) بهصورت محلی با PySpark.
تمرین پارتیشنبندی (partitioning)، اتصالها (joins) و نوشتن داده.
⚙️ تکنولوژیها: PySpark، Parquet، Python، Docker
🔗 GH Archive:
https://www.gharchive.org/
۶. لیکهاوس مدالیون (Medallion Lakehouse)
دریافت دادههای سفر تاکسی نیویورک در لایههای برنز → نقره → طلا با استفاده از فرمت جدول باز.
بهرهمندی از تکامل اسکیمای داده (schema evolution) و قابلیت time travel بهصورت پیشفرض.
⚙️ تکنولوژیها: Postgres، Apache Iceberg، Parquet، Python
🔗 معرفی Iceberg:
https://iceberg.apache.org/spark-quickstart/
۷. چارچوب کیفیت داده (Data Quality Framework)
گسترش DAG در Airflow از پروژه ۳ با افزودن بررسیهای خودکار برای: مقادیر خالی (null)، بازهها (ranges)، اسکیمای داده و بهروز بودن (freshness).
⚙️ تکنولوژیها: Great Expectations، Python، Airflow
🔗 Great Expectations:
https://docs.greatexpectations.io/docs/
https://xn--r1a.website/datalook_ir
کانال من در بله :
https://ble.ir/ai_with_mina
۱. پایپلاین API به انبار داده
(API-to-Warehouse Pipeline)
دریافت داده از یک API عمومی (مثل OpenWeather یا Spotify).
مدیریت بارگذاری تدریجی (Incremental Loading) در Postgres.
⚙️ تکنولوژیها: Python، dlt، Postgres، Docker
https://dlthub.com/docs/intro
۲. انبار داده مدرن با dbt
لود کردن دیتاست نمونه Jaffle Shop در Postgres.
ساخت مدلها از لایه staging به marts به همراه تستها، مستندسازی و اسنپشاتهای SCD2.
⚙️ تکنولوژیها: dbt Core، SQL، Postgres، Git
🔗 https://docs.getdbt.com/guides/manual-install
۳. پروژه DAG Airflow با سنسورها و backFills
زمانبندی دریافت روزانه داده از دیتاست شکایات NYC 311.
اضافه کردن سنسورها، شاخهبندی (branching) و تلاش مجدد (retry) با backoff.
⚙️ تکنولوژیها: Apache Airflow، Python، Docker
🔗 آموزش Airflow:
https://airflow.apache.org/docs/apache-airflow/stable/tutorial/
۴. استریم رویداد با Kafka
اجرای Kafka به صورت لوکال و تولید دادههای مصنوعی (مثل کلیک و سفارش) با Python و Faker.
ساخت یک consumer که دادهها را به صورت real-time تجمیع کرده و در Postgres ذخیره کند.
تکنولوژیها: Kafka، Python، Faker، Docker
🔗 مبانی Kafka:
https://developer.confluent.io/courses/apache-kafka/events/
۵. پردازش دستهای با PySpark
(PySpark Batch Processing)
پردازش دادههای یک ماه از GitHub Archive (حدود ۵۰ گیگابایت رویداد) بهصورت محلی با PySpark.
تمرین پارتیشنبندی (partitioning)، اتصالها (joins) و نوشتن داده.
⚙️ تکنولوژیها: PySpark، Parquet، Python، Docker
🔗 GH Archive:
https://www.gharchive.org/
۶. لیکهاوس مدالیون (Medallion Lakehouse)
دریافت دادههای سفر تاکسی نیویورک در لایههای برنز → نقره → طلا با استفاده از فرمت جدول باز.
بهرهمندی از تکامل اسکیمای داده (schema evolution) و قابلیت time travel بهصورت پیشفرض.
⚙️ تکنولوژیها: Postgres، Apache Iceberg، Parquet، Python
🔗 معرفی Iceberg:
https://iceberg.apache.org/spark-quickstart/
۷. چارچوب کیفیت داده (Data Quality Framework)
گسترش DAG در Airflow از پروژه ۳ با افزودن بررسیهای خودکار برای: مقادیر خالی (null)، بازهها (ranges)، اسکیمای داده و بهروز بودن (freshness).
⚙️ تکنولوژیها: Great Expectations، Python، Airflow
🔗 Great Expectations:
https://docs.greatexpectations.io/docs/
https://xn--r1a.website/datalook_ir
کانال من در بله :
https://ble.ir/ai_with_mina
👍3👌2❤1🤩1
Forwarded from Data world with Mina
درود به اعضای کانال 💫
امیدوارم اینترنت داشته باشید و در سلامت پیامم رو ببینید 🥺❤️
ممنون میشم با ری اکشن و ایموجی از خودتون و سالم بودنتون خبر بدید.
تو پیام رسان "بله" کانال زدم که تو شرایط قطعی نت بتونیم باهم در ارتباط باشیم ،گرچه این روزها هممون تاب آوری و بقا رو تمرین میکنیم.
«هوش مصنوعی و یادگیری ماشین»
🆔 شناسه:
https://ble.ir/ai_with_mina
به امید دیدار تو روزهای سپید 💫✌️
امیدوارم اینترنت داشته باشید و در سلامت پیامم رو ببینید 🥺❤️
ممنون میشم با ری اکشن و ایموجی از خودتون و سالم بودنتون خبر بدید.
تو پیام رسان "بله" کانال زدم که تو شرایط قطعی نت بتونیم باهم در ارتباط باشیم ،گرچه این روزها هممون تاب آوری و بقا رو تمرین میکنیم.
«هوش مصنوعی و یادگیری ماشین»
🆔 شناسه:
https://ble.ir/ai_with_mina
به امید دیدار تو روزهای سپید 💫✌️
❤33👎5
🎯 چطور فریمورک مناسب برای Agentهای هوش مصنوعی رو انتخاب کنیم؟
خیلیها فکر میکنن این ابزارها رقیب هم هستن، ولی واقعیت اینه:
👉 اینها فقط کتابخانههای مختلف پایتون هستن، مثل مقایسه NumPy و Pandas!
پس سوال درست اینه:
❓ «من دارم چی میسازم؟»
هر فریمورک برای یک سطح از پیچیدگی و یک نوع مسئله طراحی شده.
---
🔥 ۵ فریمورک مهم برای AI Agentها:
---
🧠 1. کتابخانه LangGraph
📌 مناسب برای:
- کنترل کامل روی state ایجنت
- ورکفلوهای پیچیده (loop، شرط، شاخهبندی)
- سیستمهای production
💡 کاربردها:
- تشخیص پزشکی مرحلهای
- بررسی اسناد با تصمیمگیری شرطی
- کشف تقلب مالی با reasoning چندمرحلهای
⚠️ کنترل بسیار بالا، ولی منحنی یادگیری سختتر
---
🤖 2. کتابخانه CrewAI
📌 مناسب برای:
- سیستمهای چند ایجنتی (multi-agent)
- معماری role-based و خوانا
- توسعه سریع و prototype
💡 کاربردها:
- تیم تحقیقاتی (یک ایجنت جستجو، یکی تحلیل)
- تولید محتوا (نویسنده، ویراستار، ناشر)
- اتوماسیون فروش
🚀 سریعترین راه برای ساخت سیستم multi-agent
---
📊 3. فریمورک PydanticAI
📌 مناسب برای:
- خروجیهای ساختاریافته
- نیاز جدی به اعتبارسنجی داده
- ادغام با پروژههای Python موجود
💡 کاربردها:
- پردازش گزارشهای مالی
- ایجنتهای API-based
- سیستمهای حساس به صحت داده
✅ ولیدیشن در سطح core (نه یه ویژگی اضافه)
---
⚙️ 4. کتابخانه OpenAI Swarm
📌 مناسب برای:
- یادگیری عمیق نحوه کار ایجنتها
- حداقل abstraction
- درک واقعی handoff بین ایجنتها
💡 کاربردها:
- پروژههای آموزشی
- پروتوتایپ سریع سیستمهای سبک
- تحلیل رفتار ایجنتها
🪶 سبکترین و شفافترین گزینه برای یادگیری
---
🔗 5. فریمورک MCP (Model Context Protocol)
📌 مناسب برای:
- اتصال ایجنتها به ابزارهای خارجی
- یکپارچهسازی بین فریمورکها
- کار با سیستمهای واقعی
💡 کاربردها:
- اتصال به دیتابیسها بدون کدنویسی اضافی
- دسترسی استاندارد به فایل سیستم
- اتصال به APIها
❗ این یک فریمورک نیست، یک پروتکل است (Glue Layer)
---
📌 جمعبندی سریع (Decision Matrix):
✔️ منطق پیچیده → LangGraph
✔️ سیستم چند ایجنتی → CrewAI
✔️ خروجی ساختاریافته → PydanticAI
✔️ یادگیری عمیق → Swarm
✔️ اتصال به ابزارهای خارجی → MCP
💬 در نهایت:
«کتابخانههای متفاوت، عمقهای متفاوت، ولی یک هدف مشترک: ساخت Agentهای کاربردی»
خیلیها فکر میکنن این ابزارها رقیب هم هستن، ولی واقعیت اینه:
👉 اینها فقط کتابخانههای مختلف پایتون هستن، مثل مقایسه NumPy و Pandas!
پس سوال درست اینه:
❓ «من دارم چی میسازم؟»
هر فریمورک برای یک سطح از پیچیدگی و یک نوع مسئله طراحی شده.
---
🔥 ۵ فریمورک مهم برای AI Agentها:
---
🧠 1. کتابخانه LangGraph
📌 مناسب برای:
- کنترل کامل روی state ایجنت
- ورکفلوهای پیچیده (loop، شرط، شاخهبندی)
- سیستمهای production
💡 کاربردها:
- تشخیص پزشکی مرحلهای
- بررسی اسناد با تصمیمگیری شرطی
- کشف تقلب مالی با reasoning چندمرحلهای
⚠️ کنترل بسیار بالا، ولی منحنی یادگیری سختتر
---
🤖 2. کتابخانه CrewAI
📌 مناسب برای:
- سیستمهای چند ایجنتی (multi-agent)
- معماری role-based و خوانا
- توسعه سریع و prototype
💡 کاربردها:
- تیم تحقیقاتی (یک ایجنت جستجو، یکی تحلیل)
- تولید محتوا (نویسنده، ویراستار، ناشر)
- اتوماسیون فروش
🚀 سریعترین راه برای ساخت سیستم multi-agent
---
📊 3. فریمورک PydanticAI
📌 مناسب برای:
- خروجیهای ساختاریافته
- نیاز جدی به اعتبارسنجی داده
- ادغام با پروژههای Python موجود
💡 کاربردها:
- پردازش گزارشهای مالی
- ایجنتهای API-based
- سیستمهای حساس به صحت داده
✅ ولیدیشن در سطح core (نه یه ویژگی اضافه)
---
⚙️ 4. کتابخانه OpenAI Swarm
📌 مناسب برای:
- یادگیری عمیق نحوه کار ایجنتها
- حداقل abstraction
- درک واقعی handoff بین ایجنتها
💡 کاربردها:
- پروژههای آموزشی
- پروتوتایپ سریع سیستمهای سبک
- تحلیل رفتار ایجنتها
🪶 سبکترین و شفافترین گزینه برای یادگیری
---
🔗 5. فریمورک MCP (Model Context Protocol)
📌 مناسب برای:
- اتصال ایجنتها به ابزارهای خارجی
- یکپارچهسازی بین فریمورکها
- کار با سیستمهای واقعی
💡 کاربردها:
- اتصال به دیتابیسها بدون کدنویسی اضافی
- دسترسی استاندارد به فایل سیستم
- اتصال به APIها
❗ این یک فریمورک نیست، یک پروتکل است (Glue Layer)
---
📌 جمعبندی سریع (Decision Matrix):
✔️ منطق پیچیده → LangGraph
✔️ سیستم چند ایجنتی → CrewAI
✔️ خروجی ساختاریافته → PydanticAI
✔️ یادگیری عمیق → Swarm
✔️ اتصال به ابزارهای خارجی → MCP
💬 در نهایت:
«کتابخانههای متفاوت، عمقهای متفاوت، ولی یک هدف مشترک: ساخت Agentهای کاربردی»
👍7❤5👎2👌1
«مهندس هوش مصنوعی» در حال تبدیل شدن به یکی از بدفهمیدهترین(اصطلاح بهتر پیدا نکردم:)) عناوین شغلی در دنیای فناوری است.
🔍وقتی مردم این عنوان را میشنوند، تصور میکنند منظور کسی است که مدلهای زبانی بزرگ را از صفر آموزش میدهد.
🔑اما واقعیت چیست؟
حداقل 4 نقش متفاوت زیر این عنوان قرار میگیرند که کاملاً با هم فرق دارند:
1_مهندس یادگیری ماشین / مهندس مدل
🔬 ML / Model Engineer
✔️پیشآموزش (Pre-training)
✔️فاینتیون (Fine-tuning)
✔️رویکرد RLHF (یادگیری تقویتی از بازخورد انسانی)
✔️ ارزیابی مدلها (Evals)
این افراد مستقیماً با وزنهای مدل کار میکنند.
این نقش از همه به حوزه تحقیق نزدیکتر است. نیازمند ریاضیات عمیق، CUDA و دانش سیستم های توزیع شده است.
2_مهندس استنتاج Inference engineer
مدل آموزش دیده است. حالا سؤال این است:
چطور آن را برای 10 میلیون کاربر با تأخیر کم و هزینه پایین سرویسدهی کنیم؟
وظایف اصلی:
✔️رویکرد Quantization (کوانتیزهسازی)
✔️رویکرد Speculative Decoding
بهینهسازی KV-Cache
✔️کرنلهای سفارشی GPU
این نقش تخصصی و بسیار اثرگذار است که تا 3 سال پیش تقریباً وجود نداشت.
🏗️ مهندس زیرساخت هوش مصنوعی / MLOps
وظایف:
✔️مدیریت کلاسترهای GPU
✔️پایپلاین استقرار مدل
✔️مقیاسپذیری خودکار زیرساخت سرویسدهی
✔️مانیتورینگ هزینهها
✔️فرآیند CI/CD برای پروژههای ML
این همان نقش «چراغها را روشن نگه دار» است؛ نقشی که باعث میشود همه بخشهای دیگر کار کنند.
🛠️ مهندس اپلیکیشن LLM
محصولاتی را بر پایه مدلها و از طریق APIها میسازد.
حوزههای کاری:
🔺پایپلاینهای RAG
🔺ورکفلوهای Agentic
🔺استفاده از ابزارها (Tool Use)
🔺طراحی پرامپت
🔺ارزیابی رفتار اپلیکیشن
این نقش معمولاً هیچ کاری با وزنهای مدل یا زیرساخت GPU ندارد.
حقیقت ناراحتکننده این است:
بیشتر آگهیهای شغلی با عنوان AI Engineer در واقع به دنبال دسته چهارم هستند.
اما بیشتر داوطلبان (و حتی مدیران استخدام) فکر میکنند منظور دسته اول است.
اگر در حال استخدام هستید:
دقیق مشخص کنید کدام نوع مهندس هوش مصنوعی را میخواهید.
منبع مطالب تحلیل داده، هوش مصنوعی، هوش تجاری و یادگیری ماشین
ارتباط با ادمین در بله
@minaDataScience
شناسه کانال در بله
@ai_with_mina
🔍وقتی مردم این عنوان را میشنوند، تصور میکنند منظور کسی است که مدلهای زبانی بزرگ را از صفر آموزش میدهد.
🔑اما واقعیت چیست؟
حداقل 4 نقش متفاوت زیر این عنوان قرار میگیرند که کاملاً با هم فرق دارند:
1_مهندس یادگیری ماشین / مهندس مدل
🔬 ML / Model Engineer
✔️پیشآموزش (Pre-training)
✔️فاینتیون (Fine-tuning)
✔️رویکرد RLHF (یادگیری تقویتی از بازخورد انسانی)
✔️ ارزیابی مدلها (Evals)
این افراد مستقیماً با وزنهای مدل کار میکنند.
این نقش از همه به حوزه تحقیق نزدیکتر است. نیازمند ریاضیات عمیق، CUDA و دانش سیستم های توزیع شده است.
2_مهندس استنتاج Inference engineer
مدل آموزش دیده است. حالا سؤال این است:
چطور آن را برای 10 میلیون کاربر با تأخیر کم و هزینه پایین سرویسدهی کنیم؟
وظایف اصلی:
✔️رویکرد Quantization (کوانتیزهسازی)
✔️رویکرد Speculative Decoding
بهینهسازی KV-Cache
✔️کرنلهای سفارشی GPU
این نقش تخصصی و بسیار اثرگذار است که تا 3 سال پیش تقریباً وجود نداشت.
🏗️ مهندس زیرساخت هوش مصنوعی / MLOps
وظایف:
✔️مدیریت کلاسترهای GPU
✔️پایپلاین استقرار مدل
✔️مقیاسپذیری خودکار زیرساخت سرویسدهی
✔️مانیتورینگ هزینهها
✔️فرآیند CI/CD برای پروژههای ML
این همان نقش «چراغها را روشن نگه دار» است؛ نقشی که باعث میشود همه بخشهای دیگر کار کنند.
🛠️ مهندس اپلیکیشن LLM
محصولاتی را بر پایه مدلها و از طریق APIها میسازد.
حوزههای کاری:
🔺پایپلاینهای RAG
🔺ورکفلوهای Agentic
🔺استفاده از ابزارها (Tool Use)
🔺طراحی پرامپت
🔺ارزیابی رفتار اپلیکیشن
این نقش معمولاً هیچ کاری با وزنهای مدل یا زیرساخت GPU ندارد.
حقیقت ناراحتکننده این است:
بیشتر آگهیهای شغلی با عنوان AI Engineer در واقع به دنبال دسته چهارم هستند.
اما بیشتر داوطلبان (و حتی مدیران استخدام) فکر میکنند منظور دسته اول است.
اگر در حال استخدام هستید:
دقیق مشخص کنید کدام نوع مهندس هوش مصنوعی را میخواهید.
منبع مطالب تحلیل داده، هوش مصنوعی، هوش تجاری و یادگیری ماشین
ارتباط با ادمین در بله
@minaDataScience
شناسه کانال در بله
@ai_with_mina
❤15🔥2👎1
چند وقت پیش یک تصویر جالب دیدم با عنوان How to Duplicate Yourself into Claude؛ یعنی چطور یک نسخه از خودت را وارد هوش مصنوعی کنی.
شاید در نگاه اول تبلیغاتی به نظر برسد، اما پشت این ایده یک مفهوم واقعی و مهم وجود دارد: اینکه بتوانی سبک فکر کردن، لحن نوشتن، ترجیحات، ارزشها و روش تصمیمگیری خودت را به یک مدل هوش مصنوعی منتقل کنی تا مثل یک دستیار شخصی حرفهای کنارت کار کند.
منظور از «کپی کردن خودت» این نیست که واقعاً انسان دیگری ساخته میشود. منظور ساختن یک نسخه دیجیتالی از ذهن و سبک کاری توست. یعنی دیگر لازم نباشد هر بار از صفر برای AI توضیح بدهی که چگونه مینویسی، چه چیزهایی را دوست داری، چه چیزهایی را قبول نداری یا خروجی را با چه استانداردی میخواهی. یک بار این اطلاعات را ساختارمند میکنی و بعد مدل میتواند بسیار هماهنگتر با تو کار کند.
مراحلی که در تصویر(در ادامه گذاشتم) برای Claude گفته شده هم جالب بود. ابتدا باید Claude را نصب کنی و حالت Cowork Mode را فعال کنی؛ حالتی که مدل را بیشتر شبیه همکار هوشمند میکند. سپس یک پوشه برای «صدای شخصی» خودت میسازی؛ یعنی جایی که نمونه نوشتهها، لحن، طرز فکر و قواعد شخصی تو در آن ذخیره شود.
بعد از آن مدل Opus انتخاب میشود و گزینه Extended Thinking فعال میشود تا مدل زمان و عمق بیشتری برای استدلال و تحلیل داشته باشد. سپس پیشنهاد شده به جای تایپ کردن، با مدل صحبت کنی و به مجموعهای از سؤالات پاسخ بدهی؛ سؤالاتی درباره سبک کار، سلیقه، روش تصمیمگیری، چیزهایی که دوست داری، چیزهایی که قبول نداری و حتی عبارتهایی که هیچوقت استفاده نمیکنی. این بخش در واقع مرحله استخراج شخصیت حرفهای توست.
در ادامه این اطلاعات خام فشرده و ساختارمند میشود و به شکل یک فایل متنی ذخیره میشود؛ چیزی شبیه پروفایل ذهنی تو. بعد این فایل در یک گفتوگوی جدید تست میشود تا مشخص شود مدل چقدر توانسته لحن و تفکر تو را بازسازی کند. سپس میتوان آن را در ابزارهایی مثل Obsidian مدیریت کرد، و حتی به مدلهای دیگر مثل ChatGPT، Gemini یا Grok هم منتقل کرد.
نکته هوشمندانه تصویر این بود که قبل از این فرآیند، کاربر زمان زیادی صرف نوشتن و توضیح دادن میکند و مدل کمتر فکر میکند. اما بعد از ساخت این نسخه شخصیسازیشده، تو کمتر تایپ میکنی و بیشتر نقش هدایتگر را داری، در حالی که مدل بخش سنگین فکر کردن و تولید خروجی را انجام میدهد.
از نگاه تخصصی، این موضوع ترکیبی از مفاهیمی مثل Prompt Engineering، Persona Modeling، AI Memory و Personal Knowledge Base است. آینده استفاده حرفهای از AI فقط سؤال پرسیدن نیست؛ بلکه ساختن سیستمهایی است که تو را بشناسند و در امتداد تواناییهایت عمل کنند.
اگر بخواهم در یک جمله بگویم:
آینده متعلق به کسانی است که فقط از AI استفاده نمیکنند، بلکه نسخهای از تخصص و ذهن خودشان را روی AI سوار میکنند.
#هوش_مصنوعی #Claude #ChatGPT #DigitalTwin #AI #Productivity #FutureOfWork #فناوری
شاید در نگاه اول تبلیغاتی به نظر برسد، اما پشت این ایده یک مفهوم واقعی و مهم وجود دارد: اینکه بتوانی سبک فکر کردن، لحن نوشتن، ترجیحات، ارزشها و روش تصمیمگیری خودت را به یک مدل هوش مصنوعی منتقل کنی تا مثل یک دستیار شخصی حرفهای کنارت کار کند.
منظور از «کپی کردن خودت» این نیست که واقعاً انسان دیگری ساخته میشود. منظور ساختن یک نسخه دیجیتالی از ذهن و سبک کاری توست. یعنی دیگر لازم نباشد هر بار از صفر برای AI توضیح بدهی که چگونه مینویسی، چه چیزهایی را دوست داری، چه چیزهایی را قبول نداری یا خروجی را با چه استانداردی میخواهی. یک بار این اطلاعات را ساختارمند میکنی و بعد مدل میتواند بسیار هماهنگتر با تو کار کند.
مراحلی که در تصویر(در ادامه گذاشتم) برای Claude گفته شده هم جالب بود. ابتدا باید Claude را نصب کنی و حالت Cowork Mode را فعال کنی؛ حالتی که مدل را بیشتر شبیه همکار هوشمند میکند. سپس یک پوشه برای «صدای شخصی» خودت میسازی؛ یعنی جایی که نمونه نوشتهها، لحن، طرز فکر و قواعد شخصی تو در آن ذخیره شود.
بعد از آن مدل Opus انتخاب میشود و گزینه Extended Thinking فعال میشود تا مدل زمان و عمق بیشتری برای استدلال و تحلیل داشته باشد. سپس پیشنهاد شده به جای تایپ کردن، با مدل صحبت کنی و به مجموعهای از سؤالات پاسخ بدهی؛ سؤالاتی درباره سبک کار، سلیقه، روش تصمیمگیری، چیزهایی که دوست داری، چیزهایی که قبول نداری و حتی عبارتهایی که هیچوقت استفاده نمیکنی. این بخش در واقع مرحله استخراج شخصیت حرفهای توست.
در ادامه این اطلاعات خام فشرده و ساختارمند میشود و به شکل یک فایل متنی ذخیره میشود؛ چیزی شبیه پروفایل ذهنی تو. بعد این فایل در یک گفتوگوی جدید تست میشود تا مشخص شود مدل چقدر توانسته لحن و تفکر تو را بازسازی کند. سپس میتوان آن را در ابزارهایی مثل Obsidian مدیریت کرد، و حتی به مدلهای دیگر مثل ChatGPT، Gemini یا Grok هم منتقل کرد.
نکته هوشمندانه تصویر این بود که قبل از این فرآیند، کاربر زمان زیادی صرف نوشتن و توضیح دادن میکند و مدل کمتر فکر میکند. اما بعد از ساخت این نسخه شخصیسازیشده، تو کمتر تایپ میکنی و بیشتر نقش هدایتگر را داری، در حالی که مدل بخش سنگین فکر کردن و تولید خروجی را انجام میدهد.
از نگاه تخصصی، این موضوع ترکیبی از مفاهیمی مثل Prompt Engineering، Persona Modeling، AI Memory و Personal Knowledge Base است. آینده استفاده حرفهای از AI فقط سؤال پرسیدن نیست؛ بلکه ساختن سیستمهایی است که تو را بشناسند و در امتداد تواناییهایت عمل کنند.
اگر بخواهم در یک جمله بگویم:
آینده متعلق به کسانی است که فقط از AI استفاده نمیکنند، بلکه نسخهای از تخصص و ذهن خودشان را روی AI سوار میکنند.
#هوش_مصنوعی #Claude #ChatGPT #DigitalTwin #AI #Productivity #FutureOfWork #فناوری
❤11🔥2
🎓 معرفی StudentAI؛ پلتفرم هوش مصنوعی مخصوص دانشجوها و یادگیری
این روزها ابزارهای AI فقط برای چت کردن نیستند و کمکم دارند تبدیل میشوند به دستیار کامل مطالعه و یادگیری. یکی از سایتهای جالب در این حوزه، StudentAI هست: https://studentai.app/
این پلتفرم مجموعهای از ابزارهای هوش مصنوعی را برای درس، تحقیق، تولید محتوا، برنامهنویسی و حتی آمادگی شغلی کنار هم آورده. مثلاً میتوانید PDF یا جزوه آپلود کنید تا خلاصهسازی شود، از داخل فایل سوال بپرسید یا نکات مهم استخراج شود. حتی لینک ویدیوی یوتیوب را هم میگیرد و تبدیلش میکند به خلاصه و Study Notes.
بخش جالب دیگرش ابزارهای نوشتاری و دانشگاهی است؛ از Essay و Paraphrasing گرفته تا تولید SOP، Cover Letter و Citation. علاوه بر این، چند AI Tutor و دستیار تخصصی هم دارد که برای یادگیری، مصاحبه شغلی یا کمک در برنامهنویسی طراحی شدهاند.
در واقع این نوع پلتفرمها دارند ترکیبی از ChatGPT + ابزار تحقیق + معلم خصوصی + دستیار تولید محتوا را در یک محیط ارائه میکنند. البته مثل هر ابزار AI، خروجیها نیاز به بررسی دارند و نباید بدون بازبینی برای کار علمی استفاده شوند؛ اما برای یادگیری سریعتر، خلاصهسازی و ایده گرفتن واقعاً میتوانند مفید باشند. 🚀
https://xn--r1a.website/datalook_ir
این روزها ابزارهای AI فقط برای چت کردن نیستند و کمکم دارند تبدیل میشوند به دستیار کامل مطالعه و یادگیری. یکی از سایتهای جالب در این حوزه، StudentAI هست: https://studentai.app/
این پلتفرم مجموعهای از ابزارهای هوش مصنوعی را برای درس، تحقیق، تولید محتوا، برنامهنویسی و حتی آمادگی شغلی کنار هم آورده. مثلاً میتوانید PDF یا جزوه آپلود کنید تا خلاصهسازی شود، از داخل فایل سوال بپرسید یا نکات مهم استخراج شود. حتی لینک ویدیوی یوتیوب را هم میگیرد و تبدیلش میکند به خلاصه و Study Notes.
بخش جالب دیگرش ابزارهای نوشتاری و دانشگاهی است؛ از Essay و Paraphrasing گرفته تا تولید SOP، Cover Letter و Citation. علاوه بر این، چند AI Tutor و دستیار تخصصی هم دارد که برای یادگیری، مصاحبه شغلی یا کمک در برنامهنویسی طراحی شدهاند.
در واقع این نوع پلتفرمها دارند ترکیبی از ChatGPT + ابزار تحقیق + معلم خصوصی + دستیار تولید محتوا را در یک محیط ارائه میکنند. البته مثل هر ابزار AI، خروجیها نیاز به بررسی دارند و نباید بدون بازبینی برای کار علمی استفاده شوند؛ اما برای یادگیری سریعتر، خلاصهسازی و ایده گرفتن واقعاً میتوانند مفید باشند. 🚀
https://xn--r1a.website/datalook_ir
studentai.app
StudentAI - AI Tools & Tutors for Students
Dedicated AI tools and tutors for students, graduates & professionals. Write better papers, ace exams, and get 24/7 AI tutoring.
❤14
Forwarded from Tech Immigrants
اندرو انگ در کنفرانس AI Dev 26. داستان آیندهای که داره اتفاق میافته
اندرو انگ دیروز رفت روی صحنه و یه داستان تعریف کرد. نه با اسلاید پر از عدد، بلکه با یه تشبیه ساده:
تصور کن فقط لگوی سفید داری. یه چیزایی میسازی، ولی نه چیز خیلی جالبی. حالا سیاه اضافه کن. آبی اضافه کن. قرمز و زرد. هرچی رنگ بیشتر داشته باشی، چیزای خفنتری میتونی بسازی. نرمافزار هم دقیقاً همینه. هر API، هر فریمورک، هر ابزار یه آجر جدیده.
حالا coding agent های AI اومدن و دوتا کار کردن: هم تعداد آجرها رو منفجر کردن، هم سرعت چیدنشون رو. و این فوقالعادهست.
ولی بعد یه چیز عجیب اتفاق افتاد.
انگ گفت کدنویسی خودش تقریباً ۱۰۰٪ AI شده. و فرقش با ۸۰٪ خیلی زیاده. چرا؟ چون وقتی ۸۰٪ کد رو AI مینویسه ولی تو باید بشینی خط به خط بررسی کنی، تو میشی bottleneck. انگار یه ماشین فراری داری ولی ترمز دستیش کشیدهست.
خب، وقتی ساختن اینقدر سریع شد، چی شد؟
انگ گفت یه پدیده عجیب دید: قبلاً یه مدیر محصول ۸ تا مهندس رو مشغول نگه میداشت. بعد شد ۱ به ۲. بعد ۱ به ۱. و بعد فهمید سریعترین حالت اینه که اصلاً این دو نفر یه نفر بشن. یه آدم که هم میفهمه چی بسازه، هم میسازه.
بعد طراحی هم bottleneck شد. حقوقی هم. بازاریابی هم. تیم مهندسی اونقدر سریع شیپ میکنه که بقیه نمیتونن همگام بشن.
نتیجه؟ تیمهای کوچیک از آدمهای همهفنحریف که با کمک AI کمی از همه چیز بلدن، بهترین عملکرد رو دارن.
آیا آخرالزمان شغلی شده؟
انگ گفت نه، صادقانه این رو نمیبینم. حتی تیمهای خودم هم نمیتونیم به اندازه کافی از این مهندسا پیدا کنیم. تقاضا عظیمه.
ولی یه مشکل واقعی هست.
آجرها. ابزارها، APIها، فریمورکها. اونقدر سریع عوض میشن که نه ما آدما میتونیم همهشون رو یاد بگیریم، نه coding agent هامون میشناسنشون. agent ها از APIهای قدیمی استفاده میکنن. توهم میزنن. مدلهای منسوخ رو صدا میزنن. چون دانششون مال ماهها پیشه.
اینجا بود که انگ گفت: ما دوتا مشکل داریم و دوتا ابزار ساختیم.
مشکل اول: agent ها بهروز نیستن. راهحل: Context Hub. مستندات تازه رو میده دست coding agent ت تا کد درست بنویسه، نه کد بر اساس حافظه کهنه.
🔗 https://github.com/andrewyng/context-hub
مشکل دوم: ما آدما هم باید سریعتر یاد بگیریم. راهحل: Code Dream. نه یه دوره آنلاین معمولی. یه مکالمه ویدیویی با نسخه AI خود انگ که میتونی وسط حرفش بپری و سؤال بپرسی، و کنارش یه ترمینال واقعی داری که همونجا تمرین کنی.
🔗 https://app.codream.ai/
خلاصه داستان: agent ها قویتر میشن، ولی به context درست نیاز دارن. ما آدما هم باید مهارتهای مکمل رو توسعه بدیم. اسمش رو گذاشته «توسعه مهارت موازی». انسان و AI کنار هم رشد کنن، نه جای هم.
🎬 ویدیو کامل سخنرانی: https://youtu.be/g8um2AEf5ZA?is=4DfzGvizN8n_7H7i
اندرو انگ دیروز رفت روی صحنه و یه داستان تعریف کرد. نه با اسلاید پر از عدد، بلکه با یه تشبیه ساده:
تصور کن فقط لگوی سفید داری. یه چیزایی میسازی، ولی نه چیز خیلی جالبی. حالا سیاه اضافه کن. آبی اضافه کن. قرمز و زرد. هرچی رنگ بیشتر داشته باشی، چیزای خفنتری میتونی بسازی. نرمافزار هم دقیقاً همینه. هر API، هر فریمورک، هر ابزار یه آجر جدیده.
حالا coding agent های AI اومدن و دوتا کار کردن: هم تعداد آجرها رو منفجر کردن، هم سرعت چیدنشون رو. و این فوقالعادهست.
ولی بعد یه چیز عجیب اتفاق افتاد.
انگ گفت کدنویسی خودش تقریباً ۱۰۰٪ AI شده. و فرقش با ۸۰٪ خیلی زیاده. چرا؟ چون وقتی ۸۰٪ کد رو AI مینویسه ولی تو باید بشینی خط به خط بررسی کنی، تو میشی bottleneck. انگار یه ماشین فراری داری ولی ترمز دستیش کشیدهست.
خب، وقتی ساختن اینقدر سریع شد، چی شد؟
انگ گفت یه پدیده عجیب دید: قبلاً یه مدیر محصول ۸ تا مهندس رو مشغول نگه میداشت. بعد شد ۱ به ۲. بعد ۱ به ۱. و بعد فهمید سریعترین حالت اینه که اصلاً این دو نفر یه نفر بشن. یه آدم که هم میفهمه چی بسازه، هم میسازه.
بعد طراحی هم bottleneck شد. حقوقی هم. بازاریابی هم. تیم مهندسی اونقدر سریع شیپ میکنه که بقیه نمیتونن همگام بشن.
نتیجه؟ تیمهای کوچیک از آدمهای همهفنحریف که با کمک AI کمی از همه چیز بلدن، بهترین عملکرد رو دارن.
آیا آخرالزمان شغلی شده؟
انگ گفت نه، صادقانه این رو نمیبینم. حتی تیمهای خودم هم نمیتونیم به اندازه کافی از این مهندسا پیدا کنیم. تقاضا عظیمه.
ولی یه مشکل واقعی هست.
آجرها. ابزارها، APIها، فریمورکها. اونقدر سریع عوض میشن که نه ما آدما میتونیم همهشون رو یاد بگیریم، نه coding agent هامون میشناسنشون. agent ها از APIهای قدیمی استفاده میکنن. توهم میزنن. مدلهای منسوخ رو صدا میزنن. چون دانششون مال ماهها پیشه.
اینجا بود که انگ گفت: ما دوتا مشکل داریم و دوتا ابزار ساختیم.
مشکل اول: agent ها بهروز نیستن. راهحل: Context Hub. مستندات تازه رو میده دست coding agent ت تا کد درست بنویسه، نه کد بر اساس حافظه کهنه.
🔗 https://github.com/andrewyng/context-hub
مشکل دوم: ما آدما هم باید سریعتر یاد بگیریم. راهحل: Code Dream. نه یه دوره آنلاین معمولی. یه مکالمه ویدیویی با نسخه AI خود انگ که میتونی وسط حرفش بپری و سؤال بپرسی، و کنارش یه ترمینال واقعی داری که همونجا تمرین کنی.
🔗 https://app.codream.ai/
خلاصه داستان: agent ها قویتر میشن، ولی به context درست نیاز دارن. ما آدما هم باید مهارتهای مکمل رو توسعه بدیم. اسمش رو گذاشته «توسعه مهارت موازی». انسان و AI کنار هم رشد کنن، نه جای هم.
🎬 ویدیو کامل سخنرانی: https://youtu.be/g8um2AEf5ZA?is=4DfzGvizN8n_7H7i
👍19❤13
بیشتر مردم فکر میکنند همهٔ مدلهای هوش مصنوعی شبیه هم هستند.
اما در سیستمهای واقعی هوش مصنوعی، مخصوصاً در ایجنتهای هوش مصنوعی (AI Agents)، انواع مختلف مدلهای زبانی نقشهای متفاوتی دارند.
این ۸ نوع مدل، آیندهٔ سیستمهای مدرن هوش مصنوعی را شکل میدهند:
۱. مدل GPT (ترنسفورمر از پیش آموزشدیده مولد)
برای تولید محتوا، پاسخگویی و استدلال عمومی.
۲. مدل MoE (ترکیب متخصصها)
شبکههای تخصصی مختلف را فعال میکند → سریعتر و بهینهتر در مقیاس بزرگ.
۳.مدل LRM (مدل بزرگ استدلال)
برای تفکر چندمرحلهای پیچیده و تصمیمگیری طراحی شده است.
۴. مدل VLM (مدل بینایی-زبان)
تصویر و متن را بهصورت همزمان درک میکند.
۵. مدل SLM (مدل زبانی کوچک)
سبک، سریع و کمهزینه؛ مناسب برای مسیریابی درخواستها یا وظایف ساده.
۶.مدل LAM (مدل بزرگ اقدام)
بر انجام عمل، استفاده از ابزارها و تعامل با APIها تمرکز دارد.
۷. مدل HLM (مدل زبانی سلسلهمراتبی)
مسائل پیچیده را به لایهها و بخشهای ساختاریافته تقسیم میکند.
۸.مدل LCM (مدل بزرگ مفهومی)
بهجای تمرکز صرف بر کلمات یا توکنها، مفاهیم سطح بالا را درک میکند.
تغییری که الان در حال رخ دادن است:
از یک مدل واحد: به سیستمهای چندمدلی
از چتبات : به ایجنت هوش مصنوعی
از پاسخ دادن : به انجام دادن
مهندسان برجستهٔ هوش مصنوعی فقط یک مدل انتخاب نمیکنند؛
آنها معماری مناسب مدل را متناسب با نیاز هر مسئله طراحی میکنند.
اگر در حال ساخت AI Agent هستی، درک این تفاوتها میتواند مزیت مهم تو باشد.
کانال تحلیل داده و هوش مصنوعی
https://xn--r1a.website/datalook_ir
اما در سیستمهای واقعی هوش مصنوعی، مخصوصاً در ایجنتهای هوش مصنوعی (AI Agents)، انواع مختلف مدلهای زبانی نقشهای متفاوتی دارند.
این ۸ نوع مدل، آیندهٔ سیستمهای مدرن هوش مصنوعی را شکل میدهند:
۱. مدل GPT (ترنسفورمر از پیش آموزشدیده مولد)
برای تولید محتوا، پاسخگویی و استدلال عمومی.
۲. مدل MoE (ترکیب متخصصها)
شبکههای تخصصی مختلف را فعال میکند → سریعتر و بهینهتر در مقیاس بزرگ.
۳.مدل LRM (مدل بزرگ استدلال)
برای تفکر چندمرحلهای پیچیده و تصمیمگیری طراحی شده است.
۴. مدل VLM (مدل بینایی-زبان)
تصویر و متن را بهصورت همزمان درک میکند.
۵. مدل SLM (مدل زبانی کوچک)
سبک، سریع و کمهزینه؛ مناسب برای مسیریابی درخواستها یا وظایف ساده.
۶.مدل LAM (مدل بزرگ اقدام)
بر انجام عمل، استفاده از ابزارها و تعامل با APIها تمرکز دارد.
۷. مدل HLM (مدل زبانی سلسلهمراتبی)
مسائل پیچیده را به لایهها و بخشهای ساختاریافته تقسیم میکند.
۸.مدل LCM (مدل بزرگ مفهومی)
بهجای تمرکز صرف بر کلمات یا توکنها، مفاهیم سطح بالا را درک میکند.
تغییری که الان در حال رخ دادن است:
از یک مدل واحد: به سیستمهای چندمدلی
از چتبات : به ایجنت هوش مصنوعی
از پاسخ دادن : به انجام دادن
مهندسان برجستهٔ هوش مصنوعی فقط یک مدل انتخاب نمیکنند؛
آنها معماری مناسب مدل را متناسب با نیاز هر مسئله طراحی میکنند.
اگر در حال ساخت AI Agent هستی، درک این تفاوتها میتواند مزیت مهم تو باشد.
کانال تحلیل داده و هوش مصنوعی
https://xn--r1a.website/datalook_ir
Telegram
Data world with Mina
minarabti32@gmail.com
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti
منبع مطالب يادگيري ماشين،پايتون ،داده كاوي ،هوش مصنوعي، دانلود داده، فيلم هاي آموزشي رايگان، داده
ارتباط با ادمین
@Datalook_mina
اینستاگرام:mina.rabti
❤22👍8
این مقاله از Towards Data Science درباره استفاده از یادگیری ماشین برای پیشبینی نتایج جام جهانی ۲۰۲۶ است که از ۱۱ ژوئن در استادیوم مکزیکوسیتی آغاز میشود.
نویسنده مجموعهای از دادهها شامل حدود ۴۹٬۰۰۰ بازی فوتبال (از سال ۱۸۷۲ تا ۲۰۲۶) را گرد هم آورده که شامل امتیازات الو (Elo)، نتایج بازیها و محل برگزاری مسابقات است.
نکات اصلی مقاله:
• نویسنده با رویکردی احتمالاتی، چند مدل یادگیری ماشین مختلف (از جمله LightGBM) را با هم مقایسه میکند تا بهترین مدل برای پیشبینی نتایج بازیها (برد میزبان، برد مهمان، یا تساوی) را پیدا کند.
• یکی از یافتهها این است که مدلها تمایل دارند نتیجه تساوی را نادیده بگیرند و آن را به اشتباه بهعنوان «برد میزبان» پیشبینی کنند، در حالی که حدود ۲۰٪ بازیها واقعاً با تساوی پایان مییابند.
• برای بهبود این مشکل، ویژگیهای جدیدی مانند تفاوت امتیاز تیمها، نرخ تساوی در ۵ بازی اخیر، و اینکه آیا بازی در زمین خودی، زمین بیطرف یا دوستانه برگزار میشود، به مدل اضافه میشوند.
📊 یه نگاه فنی و جذاب به دنیای فوتبال از دریچهی داده و یادگیری ماشین، برای کسایی که هم به فوتبال علاقه دارن هم به دیتا ساینس.
لینک مقاله:
https://towardsdatascience.com/can-machine-learning-predict-the-world-cup/?utm_campaign=tds%20daily&utm_medium=email&_hsenc=p2ANqtz--LU3CIkhxuvYVyz6NFMt1dg7-nDryNr1Thfi5oncaXlzuiYqjk_TH3XJRK6HiYbSiUUR9NumraggEdIFFHxbqqN45M-g&_hsmi=423013673&utm_source=newsletter
#جام_جهانی #جام_جهانی_2026
#پیش_بینی_فوتبال #یادگیری_ماشین
نویسنده مجموعهای از دادهها شامل حدود ۴۹٬۰۰۰ بازی فوتبال (از سال ۱۸۷۲ تا ۲۰۲۶) را گرد هم آورده که شامل امتیازات الو (Elo)، نتایج بازیها و محل برگزاری مسابقات است.
نکات اصلی مقاله:
• نویسنده با رویکردی احتمالاتی، چند مدل یادگیری ماشین مختلف (از جمله LightGBM) را با هم مقایسه میکند تا بهترین مدل برای پیشبینی نتایج بازیها (برد میزبان، برد مهمان، یا تساوی) را پیدا کند.
• یکی از یافتهها این است که مدلها تمایل دارند نتیجه تساوی را نادیده بگیرند و آن را به اشتباه بهعنوان «برد میزبان» پیشبینی کنند، در حالی که حدود ۲۰٪ بازیها واقعاً با تساوی پایان مییابند.
• برای بهبود این مشکل، ویژگیهای جدیدی مانند تفاوت امتیاز تیمها، نرخ تساوی در ۵ بازی اخیر، و اینکه آیا بازی در زمین خودی، زمین بیطرف یا دوستانه برگزار میشود، به مدل اضافه میشوند.
📊 یه نگاه فنی و جذاب به دنیای فوتبال از دریچهی داده و یادگیری ماشین، برای کسایی که هم به فوتبال علاقه دارن هم به دیتا ساینس.
لینک مقاله:
https://towardsdatascience.com/can-machine-learning-predict-the-world-cup/?utm_campaign=tds%20daily&utm_medium=email&_hsenc=p2ANqtz--LU3CIkhxuvYVyz6NFMt1dg7-nDryNr1Thfi5oncaXlzuiYqjk_TH3XJRK6HiYbSiUUR9NumraggEdIFFHxbqqN45M-g&_hsmi=423013673&utm_source=newsletter
#جام_جهانی #جام_جهانی_2026
#پیش_بینی_فوتبال #یادگیری_ماشین
Towards Data Science
Can Machine Learning Predict the World Cup? | Towards Data Science
Building an ML football forecaster in R
👍4❤3