Тармактык пакет брокеринде маалыматтарды маскировкалоо технологиясы жана чечими деген эмне?

1. Маалыматтарды маскировкалоо түшүнүгү

Маалыматтарды маскалоо маалыматтарды маскалоо деп да аталат. Бул биз маскалоо эрежелерин жана саясаттарын берген учурда уюлдук телефон номери, банк картасынын номери жана башка маалыматтар сыяктуу купуя маалыматтарды конвертациялоонун, өзгөртүүнүн же жашыруунун техникалык ыкмасы. Бул ыкма негизинен купуя маалыматтардын ишенимсиз чөйрөлөрдө түздөн-түз колдонулушуна жол бербөө үчүн колдонулат.

Маалыматтарды маскалоо принциби: Маалыматтарды маскалоо кийинки иштеп чыгууга, сыноого жана маалыматтарды талдоого маскалоо таасир этпешин камсыз кылуу үчүн баштапкы маалыматтардын мүнөздөмөлөрүн, бизнес эрежелерин жана маалыматтардын актуалдуулугун сакташы керек. Маскалоодон мурун жана кийин маалыматтардын ырааттуулугун жана жарактуулугун камсыз кылуу.

2. Маалыматтарды маскировкалоонун классификациясы

Маалыматтарды маскировкалоону статикалык маалыматтарды маскировкалоо (SDM) жана динамикалык маалыматтарды маскировкалоо (DDM) деп бөлүүгө болот.

Статикалык маалыматтарды маскировкалоо (SDM)Статикалык маалыматтарды маскировкалоо өндүрүш чөйрөсүнөн обочолонуу үчүн жаңы өндүрүштүк эмес чөйрө маалымат базасын түзүүнү талап кылат. Сезимтал маалыматтар өндүрүштүк маалымат базасынан алынып, андан кийин өндүрүштүк эмес маалымат базасында сакталат. Ушундай жол менен, сезгичтиги төмөндөтүлгөн маалыматтар өндүрүш чөйрөсүнөн обочолонуп, бизнес муктаждыктарын канааттандырат жана өндүрүштүк маалыматтардын коопсуздугун камсыз кылат.

SDM

Динамикалык маалыматтарды маскировкалоо (DDM)Ал, адатта, өндүрүш чөйрөсүндө реалдуу убакыт режиминде сезимтал маалыматтардын сезимталдыгын азайтуу үчүн колдонулат. Кээде, ар кандай кырдаалдарда бир эле сезимтал маалыматтарды окуу үчүн ар кандай деңгээлдеги маскалоо талап кылынат. Мисалы, ар кандай ролдор жана уруксаттар ар кандай маскалоо схемаларын ишке ашырышы мүмкүн.

DDM

Маалыматтарды отчет берүү жана маалымат продуктуларын жаап-жашыруу тиркемеси

Мындай сценарийлерге негизинен ички маалыматтарды көзөмөлдөө өнүмдөрү же жарнама такталары, тышкы кызмат көрсөтүү маалымат өнүмдөрү жана бизнес отчеттору жана долбоорлорду карап чыгуу сыяктуу маалыматтарды талдоо негизиндеги отчеттор кирет.

маалыматтарды отчет берүүчү продуктту жашыруу

3. Маалыматтарды жашыруу чечими

Маалыматтарды маскировкалоонун кеңири таралган схемаларына төмөнкүлөр кирет: жараксыздык, кокустук маани, маалыматтарды алмаштыруу, симметриялуу шифрлөө, орточо маани, чегерүү жана тегеректөө ж.б.

Жараксыз деп табууЖараксыздандыруу купуя маалыматтарды шифрлөөнү, кыскартууну же жашырууну билдирет. Бул схема, адатта, чыныгы маалыматтарды атайын символдор (мисалы, *) менен алмаштырат. Операция жөнөкөй, бирок колдонуучулар баштапкы маалыматтардын форматын биле алышпайт, бул кийинки маалымат тиркемелерине таасир этиши мүмкүн.

Кокустук мааниКокустук маани купуя маалыматтардын кокустук алмаштырылышын билдирет (сандар цифралардын, тамгалар тамгалардын жана символдор символдордун ордуна колдонулат). Бул маскалоо ыкмасы купуя маалыматтардын форматын белгилүү бир деңгээлде камсыздайт жана кийинки маалыматтарды колдонууга көмөктөшөт. Адамдардын жана жерлердин аттары сыяктуу кээ бир маанилүү сөздөр үчүн маскалоочу сөздүктөр керек болушу мүмкүн.

Маалыматтарды алмаштырууМаалыматтарды алмаштыруу нөлдүк жана кокустук маанилерди маскалоого окшош, бирок атайын символдорду же кокустук маанилерди колдонуунун ордуна, маскалоочу маалыматтар белгилүү бир маани менен алмаштырылат.

Симметриялык шифрлөөСимметриялык шифрлөө - бул кайтарымдуу маскалоо ыкмасы. Ал купуя маалыматтарды шифрлөө ачкычтары жана алгоритмдери аркылуу шифрлейт. Шифрленген тексттин форматы логикалык эрежелердеги баштапкы маалыматтарга шайкеш келет.

ОрточоОрточо схема көбүнчө статистикалык сценарийлерде колдонулат. Сандык маалыматтар үчүн биз алгач алардын орточо маанисин эсептеп, андан кийин сезимталдыгы төмөндөгөн маанилерди орточо маанинин айланасында кокустук түрдө бөлүштүрөбүз, ошентип маалыматтардын суммасы туруктуу бойдон калат.

Орун алмаштыруу жана тегеректөөБул ыкма санариптик маалыматтарды кокустук жылдыруу менен өзгөртөт. Жылдыруу тегеректөөсү маалыматтардын коопсуздугун сактоо менен диапазондун болжолдуу аныктыгын камсыз кылат, ал мурунку схемаларга караганда чыныгы маалыматтарга жакыныраак жана чоң маалыматтарды талдоо сценарийинде чоң мааниге ээ.

ML-NPB-5660-数据脱敏

Сунушталган модель "ML-NPB-5660"Маалыматтарды маскировкалоо үчүн"

4. Маалыматтарды жашыруунун кеңири колдонулган ыкмалары

(1). Статистикалык ыкмалар

Маалыматтарды үлгү алуу жана маалыматтарды агрегациялоо

- Маалыматтарды үлгү алуу: Маалыматтар топтомунун репрезентативдик бөлүгүн тандоо менен баштапкы маалыматтар топтомун талдоо жана баалоо идентификациядан чыгаруу ыкмаларынын натыйжалуулугун жогорулатуунун маанилүү ыкмасы болуп саналат.

- Маалыматтарды агрегациялоо: Микромаалыматтардагы атрибуттарга колдонулган статистикалык ыкмалардын (мисалы, суммалоо, эсептөө, орточолоо, максималдуу жана минималдуу) жыйындысы катары натыйжа баштапкы маалыматтар топтомундагы бардык жазууларды чагылдырат.

(2). Криптография

Криптография - сезгичтикти төмөндөтүүнүн же десенсибилизациянын натыйжалуулугун жогорулатуунун кеңири таралган ыкмасы. Шифрлөө алгоритмдеринин ар кандай түрлөрү ар кандай десенсибилизациялык эффекттерге жетише алат.

- Детерминисттик шифрлөө: кокустук эмес симметриялуу шифрлөө. Ал, адатта, ID маалыматтарын иштетет жана зарыл болгон учурда шифрленген текстти чечмелей алат жана баштапкы IDге калыбына келтире алат, бирок ачкыч тийиштүү түрдө корголушу керек.

- Кайтарылгыс шифрлөө: Хэш функциясы маалыматтарды иштетүү үчүн колдонулат, ал көбүнчө ID маалыматтары үчүн колдонулат. Аны түздөн-түз чечмелөөгө болбойт жана картага түшүрүү байланышы сакталышы керек. Мындан тышкары, хэш функциясынын өзгөчөлүгүнөн улам маалыматтардын кагылышуусу болушу мүмкүн.

- Гомоморфтук шифрлөө: Шифрленген тексттин гомоморфтук алгоритми колдонулат. Анын өзгөчөлүгү - шифрленген тексттин операциясынын натыйжасы чечмеленгенден кийинки ачык тексттин операциясынын натыйжасы менен бирдей. Ошондуктан, ал көбүнчө сандык талааларды иштетүү үчүн колдонулат, бирок аткаруу себептеринен улам кеңири колдонулбайт.

(3). Системалык технология

Бул технология купуялуулукту коргоого жооп бербеген маалымат элементтерин жок кылат же коргойт, бирок аларды жарыялабайт.

- Маскировкалоо: бул атаандаштын номери, ID картасы жылдызча менен белгиленген же дарек кыскартылган сыяктуу атрибуттун маанисин жашыруунун эң кеңири таралган десенсибилизациялоо ыкмасын билдирет.

- Жергиликтүү басуу: белгилүү бир атрибут маанилерин (тилкелерди) жок кылуу, маанилүү эмес маалымат талааларын алып салуу процессин билдирет;

- Жазууларды басуу: белгилүү бир жазууларды (саптарды) жок кылуу, маанилүү эмес маалымат жазууларын жок кылуу процессин билдирет.

(4). Псевдоним технологиясы

Псевдоманнинг – бул түз идентификаторду (же башка сезимтал идентификаторду) алмаштыруу үчүн псевдонимди колдонгон де-идентификациялоо ыкмасы. Псевдоним ыкмалары түз же сезимтал идентификаторлордун ордуна ар бир маалымат субъектиси үчүн уникалдуу идентификаторлорду түзөт.

- Ал баштапкы IDге дал келүү үчүн кокустук маанилерди өз алдынча түзө алат, картага түшүрүү таблицасын сактай алат жана картага түшүрүү таблицасына кирүүнү катуу көзөмөлдөй алат.

- Сиз ошондой эле псевдонимдерди түзүү үчүн шифрлөөнү колдоно аласыз, бирок чечмелөө ачкычын туура сактоо керек;

Бул технология көп сандаган көз карандысыз маалымат колдонуучуларынын учурларында кеңири колдонулат, мисалы, ачык платформа сценарийиндеги OpenID, мында ар кандай иштеп чыгуучулар бир эле колдонуучу үчүн ар кандай Openidдерди алышат.

(5). Жалпылоо ыкмалары

Жалпылоо ыкмасы маалыматтар топтомунда тандалган атрибуттардын майда-чүйдөсүнө чейин майдаланышын азайтып, маалыматтардын жалпы жана абстракттуу сүрөттөмөсүн берген де-идентификациялоо ыкмасын билдирет. Жалпылоо технологиясын ишке ашыруу оңой жана жазуу деңгээлиндеги маалыматтардын аныктыгын коргой алат. Ал көбүнчө маалымат продуктуларында же маалымат отчетторунда колдонулат.

- Тегеректөө: тандалган атрибут үчүн тегеректөө базасын тандоону камтыйт, мисалы, жогору же төмөн карай криминалистика, натыйжада 100, 500, 1K жана 10K жыйынтыктарын берет.

- Жогорку жана төмөнкү коддоо ыкмалары: босогодон жогору (же төмөнкү) маанилерди жогорку (же төмөнкү) деңгээлди билдирген босого менен алмаштыруу, натыйжада "Xтен жогору" же "Xтен төмөн" деген жыйынтыкка келүү.

(6). Кокустук ыкмалар

Идентификациядан чыгаруу ыкмасынын бир түрү катары, рандомизациялоо технологиясы атрибуттун маанисин рандомизациялоо аркылуу өзгөртүүнү билдирет, ошондуктан рандомизациялоодон кийинки маани баштапкы чыныгы мааниден айырмаланат. Бул процесс чабуулчунун ошол эле маалымат жазуусундагы башка атрибут маанилеринен атрибут маанисин алуу мүмкүнчүлүгүн төмөндөтөт, бирок өндүрүштүк сыноо маалыматтарында көп кездешкен натыйжадагы маалыматтардын аныктыгына таасир этет.


Жарыяланган убактысы: 2022-жылдын 27-сентябры