تکنیک های Data Sanitization

تکنیک های Data Sanitization  پردازش و عملیاتی در اوراکل می باشد برای تبدیل داده های مهم و حساس در دیتابیس های Development  بوسیله رونویسی و بازنویسی داده های واقعی به داده های غیرواقعی که از نظر ظاهری شبیه داده های واقعی می باشد.

چرا در دیتابیس های Development نیاز است اطلاعات و داده ها پاکسازی شود؟

داده ها در دیتابیس های عملیاتی تغییر ماهیت میکند به منظور امنیت و محافظت از داده های با ارزش و تغییر اطلاعات هویتی و Business  که در اکثر کشورها به منظور تعهد به قوانین شرکت ها و محافظت از داده ها انجام می شود.

محافظت از داده های با ارزش

بصورت اساسی ما دو سطح امنیت داده داریم :

اولین نوع توجه به تمامیت و درستی داده دارد در این نوع امنیت تمامی تغییرات داده ها بصورت تاکییدی کنترل می شود.

دومین نوع از امنیت محافظت از محتوی اطلاعات و داده ها واقعی از دید کاربران که این اطلاعات شامل نام و آدرس و اطلاعات تماس و لیست حساب و موجودی حساب و گردش های آن می باشد .

برخلاف نوع اول امنیت در این نوع تمامی این اطلاعات بایستی کنترل شود و در دیتابیس های Development بایستی تغییر کند.

تکنیک های Data Sanitizatioin

تیم و گروهای تست و development  نیاز دارند که با دیتابیس هایی کار کنند که از نظر ساختار و داده ها کاملا شبیه دیتابیس های محیط عملیاتی live باشد اما الزاما به دلایل امنیتی نباید باید دیتای اصلی و حساس کارکنند.

و برای اهداف تستی و development بایستی داده های حساس و مهم تغییر و پاکسازی شود بصورتی که ساختار داده ها تغییر نکند و ارزش و اعتبار داده ها از بین برود و داده های غیر مرتبط را جایگزین دیتا حساس کنید.

با یک سری تکنیک های Data Sanitizatioin که بسیار مفید و کاربردی می باشد که در این آموزش توضیح خواهیم داد.

تکنیک NULL’ing Out

یکی از تکنیک های Data Sanitization ، تکنیک Null’ing Out می باشد.

به سادگی مقادیر ستون های یک جدول را پاک کنید با Replace کردن با مقدار NULL که موثرترین راه می باشد که مطمئن می شوید داده های نامناسب قابل مشاهده نیست در محیط های تستی و development.

که این راه مطلوبیت کمی برای دیتابیس های تستی می باشد و از دیدگاه تیم های Development این راه مورد خوشایند در دیتابیس نیست.

معمولا تیم های تست با دیتا های جدوال کار می کنند پس حتما بایستی یک دیتا تقریبی باشد.

به عنوان خیلی سخت می شود افراد در تیم های تست با جدولی کار کنند که مقادیری مانند شماره مشتری ، آدرس و اطلاعات تماس نباشد و مقادیر NULL داشته باشد.

نکته : تکنیک NULL’ing Out زمانی خیلی مفید و کاربری می باشد که در موقعیت های خاص و ویژه که دیتا وجود نداشته باشد.

تکنیک Masking Data

یکی از تکنیک های Data Sanitization ، تکنیک Masking Data می باشد.

تکنیک Masking Data  به این معنی که شما یک قسمتی خاصی از مقدار را با کراکترهایی خاصی مانند X نمایش دهید. این روش خیلی موثر و کاربردی می باشد که ظاهر ونمایش ساختار مقادیر در گزارشات و ساختار داده را تغییر ندهید و فقط محتوی تغییر کند.

مانند ساختار کارت اعتباری به بصورت ۴ رقم با فاصله از هم جدا شده اند و با اعمال تکنیک Masking به شکل زیر نمایش داده می شود

۴۳۴۶ ۶۴۵۴ ۰۰۲۰ ۵۳۷۹

۴۴۹۳ ۹۲۳۸ ۷۳۱۵ ۵۷۸۷

۴۲۹۷ ۸۲۹۶ ۷۴۹۶ ۸۷۲۴

و بعد از اعمال تکنیک masking data به شکل زیر نمایش داده می شود:

۴۳۴۶ XXXX 0020 XXXX

۴۴۹۳ XXXX 7315 XXXX

۴۲۹۷ XXXX 7496 XXXX

تکنیک Subsitution

یکی از تکنیک های Data Sanitization ، تکنیک Subsitution می باشد.

در این تکنیک شما اطلاعات یک ستون را بصورت تصادفی randomly  جایگیزین می کنید با داده های اصلی بصورت نظیر به نظیر که در این صورت مقدار ساخته از نظر تعداد کراکتر و ساختار کاملا شبیه مقادیر اصلی می باشد.

برای مثال نام کاربری در جدول مشتریان می تواند با این تکنیک به نام دیگری جایگزین شود.

این روش خیلی موثر و کاربردی می باشد زمانی که مقادیری تعداد کراکترهایش و نوع نمایش آن و ساختار آن کاملا اهمیت دارد.

این تکنیک جایگزینی می تواند برای مقادیری که تعداد کراکتر زیادی دارد سخت باشد.

به عنوان مثال اگر بخواهید اطلاعات آدرس مشتری را با این تکنیک تغییر دهید بسیار زمان بر و از نظر فنی بسیار پیچیده می باشد و نیاز به تجربه و دانش کافی برای اجرای این تکنیک می باشد.

نکته : این تکنیک بیسار قدرتمند و کارامد می باشد و روال کار رابسیار سریع انجام می هد.

تکنیک Suffling Records – به هم ریختن رکوردها

این تکنیک خیلی شبیه تکنیک substitution می باشد با این تفاوت که تکنیک جایگزینی داده ها از همان داده های ستون خودش نشات می گیرد .

در این روش اساسا داده های ستون بصورت تصادفی randomly بین رکوردها در حال حرکت می باشد تا زمانی که هیچ رابطه و وابستگی و رابطه ای بین داده ها صورت گرفته وجود نداشته باشد.

این تکنیک زمانی که بخواهید رکورد های یک جدول که داده خای زیادی دارد را تغییر بسیار کاربردی و مفید می باشد.

تکنیک Number Variable

یکی از تکنیک های Data Sanitization ، تکنیک Number Variable می باشد.

این تکنیک برای داده هایی که بصورت عدد هستند مناسب و کاربردی می باشد در این تکنیک با الگوریتم خاصی بصورت ساده مقادیر عدد را بصورت تصادفی تغییر دهید .

این تکنیک زمانی که بخواهید اعداد خاصی را در یک بازه عددی مناسب و خاصی تولید کنید خیلی مناسب و کاربردی می باشد.

به عنوان مثال ستونی از جدول که شما درصد حراج محصول می باشد که مقدار ۱۰%  را دارد. شما با تولید اعداد تصادفی بین بازه ۱ تا ۹۹ تولید کرده و جایگزین می کنید.

تکنیک Gibberish Generation

یکی از تکنیک های Data Sanitization ، تکنیک Gibberish Generation می باشد.

بطور کلی در طی فرآیند پاکسازی داده های Data Sanitizatioin باید حواسمان به پاک شدن داده های مورد نیاز و واقعی باشد .

اگر دقت نکنیم ممکن است داده هایی از جمله نام مشتری و اطلاعات تماس و آدرس را پاک کنیم و برای جلوگیری از این موضوع بایستی یک Backup از جدول اصلی داشته باشیم و داده های واقعی را در جدول دیگری قرار دهیم.

 این تکنیک فرآیند پشتیبان از داده های اصلی را انجام می دهد.

اطلاعات بیشتر در مورد این مطلب : Data Sanitization

دیدگاه خود را بنویسید:

آدرس ایمیل شما نمایش داده نخواهد شد.

*

code

فوتر سایت