Delta Lake چطور ACID را به Data Lake میآورد و مشکل Upsert را برای همیشه حل میکند؟
اگه تا حالا با Data Lake سنتی کار کرده باشی، احتمالاً این دردها برات آشناست:آپدیت نداره، Delete افتضاحه، Upsert تقریباً غیرممکنه و اگه دو تا Job همزمان بنویسن… خدا به دادت برسه 😅اینجاست که Delta Lake وارد میشه.Delta Lake اومده که Data Lake رو از یه انبار فایل ساده، به…
چطور معماری Medallion با لایههای Bronze، Silver و Gold دادهٔ خام را به ارزش تبدیل میکند؟
اگر با دیتابیس، انبار داده یا سیستمهای تجزیه و تحلیل کار کرده باشی، احتمالاً اسم «معماری مدالین» (Medallion Architecture) یا همان معماری سهلایهٔ «Bronze – Silver – Gold» را شنیدهای.این معماری یکی از استانداردهای مدرن دنیای داده است و تقریباً در تمام پلتفرمهای مطرح مثل Oracle ADW، Databricks، Snowflake و…
تفاوت ETL و ELT در معماری داده مدرن: کدام روش سریعتر و کاراتر است؟
سالها مدل ETL (استخراج–تبدیل–بارگذاری) قلب معماری داده در سازمانها بود. هر دادهای که از ERP، فایلهای CSV یا سیستمهای CRM میآمد، ابتدا در سرورهای میانی پردازش میشد و بعد وارد انباره داده میگردید.اما با تحول معماریهای ابری مثل Snowflake، BigQuery و Azure Synapse، رویکرد جدیدی زاده شد: ELT.در این مقاله آموزش Data Engineering، بهصورت…
Lakehouse چیست و چرا معماری آیندهٔ مهندسی داده روی آن بنا شده؟
سالها بود مهندسین داده میان دو انتخاب گیر کرده بودند:Data Warehouse برای تحلیلهای دقیق، و Data Lake برای دادههای حجیم و خام.اما هر دو جدا از هم عمل میکردند، و همین جدایی تولید دادهی تکراری، ETLهای سنگین، و هزینههای زیاد نگهداری را رقم میزد.نتیجه؟ ظهور معماری جدیدی به نام Lakehouse بهعنوان پلی…
