Delta Lake چطور ACID را به Data Lake می‌آورد و مشکل Upsert را برای همیشه حل می‌کند؟
Delta Lake چطور ACID را به Data Lake می‌آورد و مشکل Upsert را برای همیشه حل می‌کند؟

اگه تا حالا با Data Lake‌ سنتی کار کرده باشی، احتمالاً این دردها برات آشناست:آپدیت نداره، Delete افتضاحه، Upsert تقریباً غیرممکنه و اگه دو تا Job همزمان بنویسن… خدا به دادت برسه 😅اینجاست که Delta Lake وارد می‌شه.Delta Lake اومده که Data Lake رو از یه انبار فایل ساده، به…

معماری Medallion
چطور معماری Medallion با لایه‌های Bronze، Silver و Gold دادهٔ خام را به ارزش تبدیل می‌کند؟

اگر با دیتابیس، انبار داده یا سیستم‌های تجزیه و تحلیل کار کرده باشی، احتمالاً اسم «معماری مدالین» (Medallion Architecture) یا همان معماری سه‌لایهٔ «Bronze – Silver – Gold» را شنیده‌ای.این معماری یکی از استانداردهای مدرن دنیای داده است و تقریباً در تمام پلتفرم‌های مطرح مثل Oracle ADW، Databricks، Snowflake و…

تفاوت ETL و ELT در معماری داده مدرن
تفاوت ETL و ELT در معماری داده مدرن: کدام روش سریع‌تر و کاراتر است؟

سال‌ها مدل ETL (استخراج–تبدیل–بارگذاری) قلب معماری داده در سازمان‌ها بود. هر داده‌ای که از ERP، فایل‌های CSV یا سیستم‌های CRM می‌آمد، ابتدا در سرورهای میانی پردازش می‌شد و بعد وارد انباره داده می‌گردید.اما با تحول معماری‌های ابری مثل Snowflake، BigQuery و Azure Synapse، رویکرد جدیدی زاده شد: ELT.در این مقاله آموزش Data Engineering، به‌صورت…

Lakehouse چیست
Lakehouse چیست و چرا معماری آیندهٔ مهندسی داده روی آن بنا شده؟

سال‌ها بود مهندسین داده میان دو انتخاب گیر کرده بودند:Data Warehouse برای تحلیل‌های دقیق، و Data Lake برای داده‌های حجیم و خام.اما هر دو جدا از هم عمل می‌کردند، و همین جدایی تولید داده‌ی تکراری، ETLهای سنگین، و هزینه‌های زیاد نگهداری را رقم می‌زد.نتیجه؟ ظهور معماری جدیدی به نام Lakehouse به‌عنوان پلی…