Database Labdon
881 subscribers
37 photos
3 videos
1 file
899 links
🕸 Database Academy

حمایت مالی:
https://www.coffeete.ir/mrbardia72

ادمین:
@mrbardia72
Download Telegram
🔵 عنوان مقاله
BigQuery Under the Hood: Scalability, Reliability, and Usability Enhancements for Gen AI Inference (7 minute read)

🟢 خلاصه مقاله:
BigQuery با تمرکز بر مقیاس‌پذیری، قابلیت اتکا و سهولت استفاده، اجرای Gen AI را در خود داده‌انبار پیش می‌برد. هسته بهبودها، استفاده از dynamic token‑based batching است که به‌جای شمارش ردیف‌ها، به طول توکنی ورودی‌ها توجه می‌کند و تا حد امکان ردیف‌های بیشتری را در یک درخواست جا می‌دهد. نتیجه، جهش چشمگیر کارایی است: بیش از 100 برابر برای first‑party LLMs و حدود 30 برابر برای embeddings.

از نظر قابلیت اتکا، سیستم با partial failure modes و adaptive retries تضمین می‌کند که خطای یک ردیف کل پرس‌وجو را مختل نکند؛ ردیف‌های سالم ادامه می‌یابند و خطاها با تکرارهای هوشمند و مدیریت خطا مهار می‌شوند. حاصل، بیش از 99.99٪ تکمیل پرس‌وجو بدون شکست ردیفی و بیش از 99.99٪ موفقیت در سطح ردیف است.

این توانمندی‌ها با تجربه کاربری ساده ارائه می‌شوند: انتخاب خودکار اندازه بچ‌ها، تعادل میان تاخیر و توان عملیاتی، و ارایه بازخورد شفاف درباره خطاها و بازیابی. جمع‌بندی اینکه کاربران می‌توانند استنتاج LLM و embeddings را مستقیماً در BigQuery با سرعت بالا و پایداری قوی اجرا کنند، بدون نیاز به تغییرات پیچیده در کد یا عملیات.

#BigQuery #GenAI #LLMInference #Scalability #Reliability #Embeddings #Batching #DataWarehouse

🟣لینک مقاله:
https://cloud.google.com/blog/products/data-analytics/bigquery-enhancements-to-boost-gen-ai-inference/?utm_source=tldrdata


👑 @Database_Academy