هوش مصنوعی و علم داده به فارسی
6.08K subscribers
977 photos
261 videos
316 files
1.05K links
🗨 ارتباط با ما (تبلیغات، سوال، پیشنهاد و انتقاد):
📩 @Contact2Mebot

💯 کانال دوم ما:
@Datascientists_Files

💎 در پیام‌رسان بله(آپدیت اتومات):
https://ble.ir/dataplusscience

💡 در پیام‌رسان ایتا(آپدیت اتومات):
https://eitaa.com/DataPlusScience
Download Telegram
🤖 نسخه جدید PaddleOCR‑VL 1.6

🌟 نسخهٔ 1.6 مدل PaddleOCR‑VL (سیستم تشخیص متن و ساختارهای مرسوم در اسناد) به‌روزرسانی شد و در آزمایش OmniDocBench به 96.33 % دقت رسید که جدیدترین SOTA است.

📊 این بهبود شامل تشخیص دقیق‌تر جداول، متن‌های معمولی، نمادهای نادر، مهرهای رسمی و قطعات گرافیکی است؛ همچنین سازگاری کامل با معماری v1.5 دارد و نیازی به مهاجرت نیست، لذا می‌تواند به‌صورت plug‑and‑play افزوده شود.

📁 کاربردهای کلیدی شامل پردازش قراردادهای مالی، اسناد حقوقی، گزارش‌های پژوهشی، آرشیوهای تاریخی، پیاده‌سازی‌های RAG (Retrieval‑Augmented Generation) و تهیه داده‌های با کیفیت برای LLMها می‌شود.


🔹 دقت برتر: رکورد اول در OmniDocBench v1.5 و Real5‑OmniDocBench.


📊 DataScience 🇮🇷 — هوش مصنوعی و علم داده به فارسی
📩 ارتباط با ما



#خبر #PaddleOCR