1. Маалыматтарды маскалоо түшүнүгү
Маалыматты маскалоо ошондой эле маалыматтарды маскалоо деп аталат. Бул уюлдук телефон номери, банк картасынын номери жана башка маалымат сыяктуу купуя маалыматтарды конвертациялоо, өзгөртүү же жабуунун техникалык ыкмасы. Бул ыкма биринчи кезекте купуя маалыматтардын ишенимсиз чөйрөдө түздөн-түз колдонулушун алдын алуу үчүн колдонулат.
Маалыматтарды маскалоо принциби: Берилиштерди маскалоо кийинки иштеп чыгуу, тестирлөө жана маалыматтарды талдоо маскалоонун таасирин тийгизбеши үчүн баштапкы маалыматтардын мүнөздөмөлөрүн, бизнес эрежелерин жана маалыматтардын актуалдуулугун сактоосу керек. Маскалоого чейин жана кийин маалыматтардын ырааттуулугун жана аныктыгын камсыз кылуу.
2. Маалыматтарды маскалоо классификациясы
Маалыматты маскалоону статикалык маалыматтарды маскалоо (SDM) жана динамикалык маалыматтарды маскалоо (DDM) деп бөлүүгө болот.
Статикалык маалыматтарды маскалоо (SDM): Статикалык маалыматтарды маскалоо өндүрүш чөйрөсүнөн обочолонуу үчүн жаңы өндүрүштүк эмес чөйрө маалымат базасын түзүүнү талап кылат. Сезимтал маалыматтар өндүрүш базасынан чыгарылып, андан кийин өндүрүштүк эмес маалымат базасында сакталат. Ошентип, десенсибилизацияланган маалыматтар өндүрүштүк чөйрөдөн обочолонуп, бизнес муктаждыктарына жооп берет жана өндүрүш маалыматтарынын коопсуздугун камсыз кылат.
Динамикалык маалыматтарды маскалоо (DDM): Ал жалпысынан өндүрүш чөйрөсүндө реалдуу убакытта сезимтал маалыматтарды сезимсиздандыруу үчүн колдонулат. Кээде, ар кандай кырдаалдарда бир эле купуя маалыматтарды окуу үчүн масканын ар кандай деңгээлдери талап кылынат. Мисалы, ар кандай ролдор жана уруксаттар ар кандай маска схемаларын ишке ашырышы мүмкүн.
Маалыматтарды отчеттуулук жана маалымат продуктуларын маскалоо колдонмо
Мындай сценарийлер, негизинен, ички маалыматтарды көзөмөлдөө өнүмдөрүн же билборддорду, тышкы кызматтын маалымат продуктуларын жана бизнес отчеттору жана долбоорду карап чыгуу сыяктуу маалыматтарды анализдөөнүн негизиндеги отчетторду камтыйт.
3. Маалыматтарды маскалоо чечими
Маалыматтарды маскалоонун кеңири таралган схемаларына төмөнкүлөр кирет: жараксыз деп табуу, кокус маани, маалыматтарды алмаштыруу, симметриялык шифрлөө, орточо маани, офсеттик жана тегеректөө ж.б.
Жарамсыздык: Жарамсыздык купуя маалыматтарды шифрлөө, кыскартуу же жашырууну билдирет. Бул схема, адатта, реалдуу маалыматтарды атайын белгилер менен алмаштырат (мисалы, *). Операция жөнөкөй, бирок колдонуучулар баштапкы маалыматтардын форматын биле алышпайт, бул кийинки маалымат колдонмолоруна таасир этиши мүмкүн.
Random Value: Кокус маани сезимтал маалыматтарды туш келди алмаштырууну билдирет (сандар цифраларды алмаштырат, тамгалар тамгаларды алмаштырат жана символдор символдорду алмаштырат). Бул маскалоо ыкмасы белгилүү бир деңгээлде купуя маалыматтардын форматын камсыздайт жана маалыматтарды кийинки колдонууну жеңилдетет. Маскалоочу сөздүктөр адамдардын жана жердин аттары сыяктуу кээ бир мааниси бар сөздөр үчүн керек болушу мүмкүн.
Маалыматтарды алмаштыруу: Маалыматты алмаштыруу нөлдүк жана кокустук маанилердин маскаланышына окшош, өзгөчө белгилерди же кокус маанилерди колдонуунун ордуна, маскаланган маалыматтар белгилүү бир мааниге алмаштырылат.
Симметриялык шифрлөө: Симметриялуу шифрлөө - бул өзгөчө кайтарымдуу маскалоо ыкмасы. Ал шифрлөө ачкычтары жана алгоритмдер аркылуу купуя маалыматтарды шифрлейт. Шифрленген тексттин форматы логикалык эрежелердеги баштапкы маалыматтарга шайкеш келет.
Орточо: Орточо схема көбүнчө статистикалык сценарийлерде колдонулат. Сандык маалыматтар үчүн биз адегенде алардын орточо маанисин эсептейбиз, андан кийин десенсибилизацияланган маанилерди орточонун айланасына туш келди бөлүштүрөбүз, ошентип маалыматтардын суммасын туруктуу сактайбыз.
Офсеттик жана тегеректөө: Бул ыкма санариптик маалыматтарды кокус нөөмөт менен өзгөртөт. Офсеттик тегеректөө диапазонун болжолдуу аныктыгын камсыздайт, ал эми мурунку схемаларга караганда реалдуу маалыматтарга жакын жана чоң маалыматтарды талдоо сценарийинде чоң мааниге ээ болгон маалыматтардын коопсуздугун сактоо менен.
Сунушталган модель"ML-NPB-5660"Маалыматтарды маскалоо үчүн
4. Көбүнчө колдонулган маалыматтарды маскалоо ыкмалары
(1). Статистикалык техникалар
Маалыматтарды тандоо жана маалыматтарды топтоо
- Маалыматтарды тандап алуу: Берилиштер топтомунун өкүлчүлүгүн тандоо жолу менен баштапкы маалыматтар топтомун талдоо жана баалоо идентификациядан чыгаруу ыкмаларынын натыйжалуулугун жогорулатуунун маанилүү ыкмасы болуп саналат.
- Маалыматтарды топтоо: Микромаалыматтардагы атрибуттарга колдонулган статистикалык ыкмалардын (мисалы, жыйынтыктоо, эсептөө, орточо алуу, максимум жана минималдуу) жыйындысы катары, натыйжа баштапкы маалыматтар топтомундагы бардык жазуулардын өкүлү болуп саналат.
(2). Криптография
Криптография десенсибилизациялоонун же эффективдүүлүгүн жогорулатуунун кеңири таралган ыкмасы. Шифрлөө алгоритмдеринин ар кандай түрлөрү ар кандай десенсибилизация эффекттерине жетише алат.
- Детерминисттик шифрлөө: кокустук эмес симметриялык шифрлөө. Ал, адатта, ID маалыматтарын иштетет жана зарыл болгон учурда шифрди чечмелеп, баштапкы идентификаторуна шифрленген текстти калыбына келтирет, бирок ачкыч туура корголушу керек.
- Кайтарымсыз шифрлөө: хэш-функциясы адатта ID маалыматтары үчүн колдонулган маалыматтарды иштетүү үчүн колдонулат. Аны түздөн-түз чечмелөө мүмкүн эмес жана карта байланышы сакталышы керек. Мындан тышкары, хэш-функциянын өзгөчөлүгүнө байланыштуу маалыматтар кагылышуусу мүмкүн.
- Гомоморфтук шифрлөө: Шифрленген тексттин гомоморфтук алгоритми колдонулат. Анын өзгөчөлүгү шифрленген тексттин операциясынын натыйжасы дешифрленгенден кийинки ачык текст операциясынын натыйжасы менен бирдей болушунда. Ошондуктан, ал, адатта, сандык талааларды иштетүү үчүн колдонулат, бирок ал көп аткаруу себептерден улам колдонулган эмес.
(3). Системалык технология
Басуу технологиясы купуялуулуктун коргоосуна жооп бербеген маалымат элементтерин жок кылат же коргойт, бирок аларды жарыялабайт.
- Маскалоо: бул оппоненттин номери, ID-карта жылдызча менен белгиленген же дарек кыскартылган сыяктуу атрибуттун маанисин маска кылуунун эң кеңири таралган десенсибилизация ыкмасына тиешелүү.
- локалдык басуу: өзгөчө атрибуттардын маанилерин (мамычаларын) жок кылуу, маанилүү эмес маалымат талааларын алып салуу процессин билдирет;
- Жазууну токтотуу: конкреттүү жазууларды (катарларды) жок кылуу, маанилүү эмес маалымат жазууларын жок кылуу процессин билдирет.
(4). Pseudonym Technology
Псевдоманнинг - түз идентификаторду (же башка сезгич идентификаторду) алмаштыруу үчүн псевдонимди колдонгон де-идентификация ыкмасы. Псевдоним ыкмалары ар бир жеке маалымат субъекти үчүн тике же сезгич идентификаторлордун ордуна уникалдуу идентификаторлорду түзөт.
- Ал түпнуска идентификаторго дал келүү үчүн өз алдынча кокустук маанилерди түзө алат, карта түзүү таблицасын сактап, картографиялык таблицага кирүү мүмкүнчүлүгүн катуу көзөмөлдөй алат.
- Сиз ошондой эле псевдонимдерди чыгаруу үчүн шифрлөөнү колдоно аласыз, бирок чечмелөө ачкычын туура сактоо керек;
Бул технология ачык платформа сценарийинде OpenID сыяктуу көп сандагы көз карандысыз маалымат колдонуучулары үчүн кеңири колдонулат, мында ар кандай иштеп чыгуучулар бир эле колдонуучу үчүн ар кандай Openids алышат.
(5). Жалпылоо техникалары
Жалпылоо техникасы маалымат топтомундагы тандалган атрибуттардын гранулярдуулугун азайтуучу жана маалыматтардын бир кыйла жалпы жана абстракттуу сүрөттөлүшүн камсыз кылган идентификациядан ажыратуу ыкмасын билдирет. Жалпылоо технологиясын ишке ашыруу оңой жана рекорддук деңгээлдеги маалыматтардын аныктыгын коргой алат. Ал көбүнчө маалымат продуктыларында же маалымат отчетторунда колдонулат.
- Тегеректөө: тандалган атрибут үчүн тегеректөө негизин тандоону камтыйт, мисалы, өйдө же ылдый карай криминалистика, 100, 500, 1К жана 10К натыйжаларды берет
- Жогорку жана төмөнкү коддоо ыкмалары: Босогодон жогору (же ылдый) маанилерди "X жогору" же "X төмөн" натыйжасын берген жогорку (же төмөнкү) деңгээлди билдирген босого менен алмаштырыңыз
(6). Randomization Techniques
Де-идентификациялоо ыкмасынын бир түрү катары, рандомизациялоо технологиясы рандомизациялоо аркылуу атрибуттун маанисин өзгөртүүнү билдирет, ошентип рандомизациядан кийинки маани баштапкы чыныгы мааниден айырмаланат. Бул процесс чабуулчунун ошол эле маалымат жазуусундагы башка атрибут баалуулуктарынан атрибут маанисин алуу мүмкүнчүлүгүн азайтат, бирок өндүрүштүк сыноо маалыматтарында кеңири таралган натыйжадагы маалыматтардын аныктыгына таасирин тийгизет.
Посттун убактысы: 27-сентябрь 2022