bs-preloader__icon
ru kz en

Big Data: медальдің кері жағы-2

Big Data саласындағы белгілі қазақстандық маман Сергей Ахметов Lifeinsurance журналына берген сұхбатының екінші бөлімінде Интернет желісінде, соның ішінде әлеуметтік желілерде деректердің қауіпсіздігінің бүге-шегесі туралы баяндап берді.
Big Data: медальдің кері жағы-2

- Жарайды. Деректердің қауіпсіздігі тақырыбына оралайқшы. Big Data бойынша Сіздің соңғы мақалаларыңыздың бірі «Әлеуметтік медиамен жасалған әрбір алмасу, әрбір цифрлық үрдіс, әрбір қосылған құрылғы түрлі компаниялармен пайдаланылатын үлкен деректерді түрлендіреді», - деген сөздермен басталады. Айтыңызшы, қазір елімізде деректерді пайдаланумен жағдай қалай болып жатыр?

- Сізге бір қызықты кейс туралы айтып берейін. Бір кішкентай компания, оны «Х» деп атайық, 2 жылдың ішінде жеке деректердің «шикі» сатушылардың біріне айналды. Бәрі Social fishing немесе сәйкестендіру сервисінен басталды. Сервистің негізгі міндеті – әлеуметтік желілерде сіздің профиліңіз туралы деректерді алу болып табылады. Яғни Сізге арнайы код орналасқан сайтқа кіру ғана жеткілікті, сайт сіздің әлеуметтік желілердегі профиліңізде сақталған ақпаратты: аты-жөні, туған күні, телефон, e-mail сияқты деректерді алады.

Бұл қалай жұмыс жасайды?

Мұнда оқиғалардың нұсқалары өте көп. Мен ең негізгілерді қарастырамын:

Көзге көрінбейтін батырмалар немесе  кликджекинг. Сіз белгілі бір компанияның сайтына кіріп, оның парақтарын қарап отырасыз. Кенеттен Сізге осы ұйымның менеджері хабарласып, немесе қоңырау шалып, Сіз телефон нөмірін қалдырмасаңыз да, Сізге осы ұйымның қызметтерін ұсына бастайды.

Бұл сайтта жеке деректерді ұрлайды. Және бұдан қорғануға болмайды.

Сіз тінтуірді басқан кезде – сілтемеге ма, немесе жай бос орынға ма, ол маңызды емес скрипт – әлеуметтік желідегі көзге көрінбейтін элементті (мысалы, топқа кіру батырмасы, немесе зиян келтіретін қосымшаны авторизациялау батырмасы) Сізге білдіртпей қосып жібереді. Сіз сол элементті басып, жеке деректерді қарауға рұқсатыңызды бересіз. Мұндай сервистерді сәйкестендіру пайызы 15%-дан бастап 60%-ға дейін құрайды.

Сізде «Сіздің телефон нөміріңіз бен e-mail қайдан алды» деген сауал тууы мүмкін. Сізді ешкім бұзып алған жоқ, деп айта аламын. Кликджекинг принципі бойынша жұмыс істейтін сервистің 80%  ВКонтакте, Mail.ru немесе Одноклассники әлеуметтік желілерді пайдаланады.

Интернетте телефон нөмірлерінің және ВКонтакте желідегі ID-мен (сіздің ерекше нөмеріңіз немесе ник) e-mail мекенжайының базасы сатылады. Әрі қарай бағдарлама тек база бойынша ID сәйкестендіріледі және жеке кабинетке телефон мен e-mail жүктеледі.

Алайда мұндай механика барлық әлеуметтік желілерде істей бермейді. Мысалы, Facebook-пен бұл істемейді, сондықтан басқа стратегия қолданылады: арнайы бағдарламалық қамтамасыз ету арқылы нөмірлердің комбинацияларымен алдын ала түрлендірілген базасына салып жүктеледі.

Facebook-те осы механиканың мысалы: Телефон нөмірінің 16 кодын алып (702,701,747 және т.б.) және олардың әрқайсысы үшін 0-ден бастап 10 миллионға дейін сандарды қоямыз. Бір телефон нөміріне тұтынушылардың қалыңдығы тым жоғары болғандықтан, онды тізімді 50 нөмірден топтарға бөлуге болады. Нәтижесінде біз 160 000 000 / 50 = 3 200 000 блок аламыз. Facebook серверіне сұрау жолдау орта есеппен 200 мс дейін (арнаға байланысты) уақыт алады. Сонымен бір клиент бір ағында секундына 5 сұрау жібере алады.  3.2М / 5 / 60сек / 60мин ≈ 177.7 сағат бұл бір аптадан көбірек уақытты алады. Дәл осындай картина e-mail-адрестеріне де қатысты болады – сұрау салу арқылы e-mail белгіленген диапазоны өңделеді.

Facebook-те құпиялылық баптауларында (Facebook-Баптаулар-Құпиялылық) «Кім мені таба алады?» деген қызмет бар, мұнда «Достар және достардың достары» параметрін белгілеуге болады.  Бұл баптаулар Сізді құтқармайтындығын айтқым кеп отыр. Бүгінгі таңда мәліметтерді жинаумен кәсіби тұрғыда айналысатын боттардың үлкен желілері бар.

Одноклассники желісіМұнда сертификатты ауыстыру арқылы Facebook-тегідей іс-әрекетті жасауға болады.

YouTube: кликджекинг арқылы YouTube-те Сіздің id (сіздің ник) табуға болады.  Ник өзі ешқандай ақпарат бермейді. Бірақ ақпараттың жалпы жиынтығында және Data біріккен базасында әлеуметтік желілерден және басқа дереккөздерінен барлық мәліметтер жинақталады, бұл YouTube-та никтің артында нақты адамды анқтауға болады.

Іздеу жүйелері не дейді?

Іздеу жүйелері дербес деректерді алудың осындай тәсілдері байқалған сайттарды іздеу арқылы шығаруды тауып алады және төмендетеді, бұл арқылы сайттарды төмендетіп, немесе зарарлы бағдарламалық қамсыздандырумен  парақшалардға тыйым салынады (бан). Яндекс осындай сайттармен күресудің тәсілін сипаттайтын бөлімді шығарды. Google де оларды анықтай бастады: мұндай порталдар Adwords жарнамалық желідегі тексеруден өтпеген жағдайлар да болды. Алайда көптеген сервистер іздеу роботтарын қиналмай-ақ айналып өтеді.

- Ал сол «Х» шағын компаниясына не болды?

- Олар әрі қарай дамып, бүкіл Интернеттен пайдаланушылар туралы ақпаратты жинай бастады. Мысалы, телефон нөмірі немесе e-mail алы, оны Крыша, OLX, Колеса сияқты ірі сайттардан іздейсіз, базаға енгізіп, бүкіл дербес деректерді аласыз. Кейіннен бұл жігіттер гео-меткаларды жинауды үйренді, жалпы ашық дереккөздерінен 140 параметрі бойынша мәліметтер жинақталды. Шын мәнінде, ешкім ешкімді бұзып алған жоқ, бұрын көп мәліметтер енгізіліп, солардың барлығын бір жерге жинақтады. GetContact бойынша мәліметтер. Бұл ТМД аймағындағы мәліметтердің ең ірі «қара» провайдерлерінің бірі. 150 теңге төлейсіз де адам туралы толық портретті аласыз.

Сіз туралы мәліметтер бар жеке карточкалардың базасы бар. Қайдан? Бұл ақпаратты бір данадан, сондай-ақ жиынтықта да, сғни миллиондаған жолдарымен сататын адамдар да компаниялар да бар. Деректердің картотекасы – бұл сіз тіркелген әлеуметтік желілер, аты-жөніңіз, туған күніңіз, жұмыс орныңыз, біліміңіз, туыстарыңыз, қызығушылықтарыңыз, өмір сүрген қалаңыз, сіз қолданатын мессенджерлеріңіз, әлеуметтік желіде отыратын уақытыңыз және т.б. туралы ақпарат. Әдетте, базаны компаниялар мақсатты аудиторияның портретін нақтылау үшін немесе телефон нөмірі бойынша клиенттік базаны кеңейту үшін сатып алады.

Жалпы Қазақстанда үнемі базаны саудаға шығарады. Мысалы, бір ірі ресейлік тренингтік компанияның клиенттер базасына, оның ішінде Қазақстаннан да, еркін қол жеткізуге болады, оны оп-оңай жүктеп алуға болады. Оның ішінде ЖСН болмайды, әрине, бірақ оны біліп алу қиынға соқпайды, белгілі бір сайттарда жеке тұлғаның аты-жөнін енгізе бастағанда, осы мәліметтер шығады, ал ЖСН болған жағдайда, заңды фирмалар бойынша мәліметтерді және басқа да ақпаратты білуге болады. Көптеген компаниялар осы мәліметтерді клиенттік базаны толықтыру үшін пайдаланады, және мұнда этиканы сақтау жөнінде ешкім ойламайды. Сізге де түрлі фирмалар қоңырау шалып өз қызметтерін ұсынған шығар. Алайда шын мәнінде адамдардың өзі түрлі мәліметтерді түрлендіреді, авторлық құқықтарды бұзады, мысалы, өз парақшасында Marvell фильмдерін жариялайды.

Мәлімететрдің мониторингіне келетін болсақ. Қазақстанды алайық, барлық пайдаланушыларды бөлеміз, мысалы, 200 мыңдай адам саясат туралы түрлі тақырыптарды қозғады. Әлеуметтік желідегі, мысалы Facebook-те негізгі сөздер бойынша мониторинг айына 350 мың теңге шамасында тұрады. Бүкіл Интернет бойынша, барлық әлеуметтік желілер бойынша мониторингті жүргізетін кешенді барлау сервистері бар. Біздің елімізде осындай толық жүйе әлі жоқ, біз ресейлік жүйелерді, мысалы, Brand Analytics, YouScan және т.б. желілерді пайдаланамыз. Мұндай сервистер шамамен 200-600 мың тұрады. Барлығы енгізіп отырған негізгі сөздердің санына, ескерілу дәрежесіне байланысты болады.

- Соңғы жылдары Батыста Желідегі адамдар мәліметтерінің қауіпсіздігі, алаяқтық жағдайлары туралы мәселе жиі көтеріледі. Бұндай жағдайда пайдаланушылардың өзі олардың мәліметтерін пайдаланудан өздерін қауіпсіздендіре алады ма немесе бұл Интернетте жұмысын толығымен тоқтатқан жағдайда ғана мүмкін бе?

- Мен жақында түрлі елдердегі сайттарда пайдаланушылар келісімін, құпиялылық саясатын қарап шығу уақыты туралы деректерді оқығанмын. Қазақстанда бұл қарап шығу тек 2 секунд уақытты алады екен, яғни адамдар бұл келісімдерді оқымайды екекн, біз осындай келісімді оқып шығудың ең қысқа мерзімімен елдердің бірінші үштігіне кіреді екенбіз. Ал Америкада болса, мұндай келісімдерді оқып шығу мерзімі 4 сағтқа, кейде бірнеше күнге созылуы мүмкін. Олар компанияға қоңырау шалып: «Ал мынау 6-тармақта Сіз нені меңзеп тұрсыз?», - деп сұрақ қояды. Егер Facebook-тің құпиялылық саясатын оқитын болсақ, олар барлық гео-мәліметтерді қаншалықты ұзақ сақтағысы келеді, сонша сақтайтындығын ашық айтады.

Адамдардың өздері өз туралы мәліметтерді, суреттерін ашық түрде: қайда барғандарын, кіммен кездескенін және т.б. жариялайтындығын қайталап айтамын. Тіпті аккаунт жабық болғаның өзінде Сізге достар қатарына арнайы «бот» «тоқылдату мүмкін» және Сіздің деректеріңізді көшіре алады. Егер Сіз оны өзіңіз достарыңыздың қатарына қосатын болсаңыз. Бірақ егер Сіз басқа ашық парақшада жазба қалдыратын болсаңыз, оны да арнайы сервистер есептеп алады. Шамамен бір жарым жылдан кейін бағдарламашылар суреттерді де есептей алатын болады.

- Қауіпсіздік нормаларының қандай қарапайым түрлері бар?

- Мен, мысалы, өзіме басқа телефон нөмірімді алып, басқа электрондық поштаны жасап, оларды өзімнің барлық әлеуметтіа желілерде көрсеттім. Басқа амал жоқ. Сіз интернетте не істесеңіз де, Сізді үнемі біреулер қадағалап отырғаның есіңізден шығармағаныңыз жөн. Сіздің мәліметтеріңіз түрлі мақсаттарда пйдалануы мүмкін.

- Осы жігіттер жүзеге асыратын мәліметтерді жинақтау қаншалықты заңды болып табылады?

- Мысалы, Қазақстанда Дербес деректер туралы заңына сәйкес егер адамды сәйкестендіру мүмкін болмаса, оны дербес деректер деп есептеуге болмайды. Егер аты-жөні мен суреті болса, бұл дербес деректерге жатады. Көптеген компаниялар бұл параметрді (аты-жөні, ЖСН) шифрлайды, оны Е75 ұяшық деп атауы мүмкін. Оларды тексеруге біреулер келсе де, бұл дербес деректер екенін дәлелдеуге қиын болады.

- Осы мәліметтерді қаншалықты жиі және кім оларды сатып алады?

- Негізінен, түрлі компаниялар өте жиі сатып алады. Егер оларға клиент келіп, өз телефон нөмірін берсе, оны сатып алған мәліметтер базасына енгізіп алып, олар бұл клиент туралы бәрін, оның толық портретін, қаржылық мүмкіндіктерін, артықшылығын білетін болады. Одан да арғысын, өнімді жасауға болады, бұл компанияның этикасы мен миссиясы мәселесіне жатады.

- Бірақ әлеуметтік желілердегі пайдаланушылардың парақшаларындағы мәліметтер ашық және барлығына қолжетімді болса, онда компаниялар бұл адам олардың әлеуетті клиент болып табылады ма, жоқ па екенін түсіну үшін бұл деректерді пайдалана алады. Және ол адам әлеуетті клиент болып табылса, оған жарнама арқылы әсер ету керек. Алайда жеке тұлғалардың парақшаларындағы ақпаратты пайдалану арқылы жеке тұлғаларға белгілі бір қызметтердің ұсынысына адамдар олардың жеке деректерін бейәдеп пайдалануына қатысты наразылық білдірген жағдайлар кездесті. Бұл ақпарат ашық болғаның қайталаймын. Сіздің ойыңызша, компаниялар не істеу керек және мұнда этикалық шек қайда өтеді?  

- Мен олай істемеуге кеңес берер едім. Әдепті жолмен баруға болады. Мысалы, электрондық поштаға жіберу, ретаргетингті пайдалануға болады, онлайн-жарнама жарнамаланған өнімді көріп, жарнама берушінің веб-сайтына кіріп көрген пайдаланушыларға ғана жіберіледі. Арнайы бағдарламалар арқылы әлеуетті клиенттердің телефондарын Facebook, Yandex-ке жүктеуге болады, сіздің жарнамаңыз тек осы адамдарға ғана көрінетін болады. Алдымен клиентті «жылытып алу қажет», оған бірдеңені тегін беріп, жеңілдіктер мен сыйлықтарды сыйлауға болады. Осылай етіп Ресейдегі Тинькофф компаниясы жасайды. Ол аудиторияны микросегменттерге бөліп, бір даналап жұмыс істейді. Сол Батыста жаңа клиентті тартудан гөрі бұрынғы клиентті ұстап қалу оңай екенін түсінеді және өзінің сервисі мен абыройы бойынша көбірек жұмыс жасайды, сенімге кіріп, кем дегенде алдағы 10 жылға , келешекке жұмыс істеуге тырысады. Олар «қара база» бойынша жұмыс істемейді, өйткені бұл әдептілікке жатпайды.

- Сіз компанияларға Big Data дұрыс пайдалану бойынша қандай ұсыныстарды берер едіңіз?

- Сіз Big Data технологиясын енгізу туралы шешім қабылдаған кезде, қолданыста қандай ақпарат бар, қанша ақпарат бар, қандай нәтижелерге қол жеткізуге мүмкіндік беретіндігін анық түсну керек.

- Сіз қалай ойлайсыз, Қазақстанға Еуропалық Одақ сияқты өз азаматтарының деректерін қорғау үшін ұқсас шараларды қабылдау керек пе, бұл шаралар біздің қазіргі заманғы жағдай қаншалықты барабар болады? Осы жылдың 25 мамырдан бастап ЕО Еуропалық Одақтың елдерінде Деректерді қорғаудың жалпы қағидалары (GDPR) күшіне енгенін естеріңізге сала кетейін. Мысалы, енді әрбір пайдаланушы осы қағидаларға сәйкес ол туралы жиналған барлық деректерді жоюға құқылы, яғни «ұмытылу құқығын» пайдалана алады. Егер оның талабы 72 сағаттың ішінде орындалмаса, онда орындаушыларға олардың жыл сайынғы  әлемдік табысының 2% мөлшерінде немесе 10 млн евро мөлшерінде (қайсысы көбірек болатынына байланысты) айыппұл салынуы мүмкін. Адам деректерін басқа елге заңсыз жіберу немесе пайдаланушы туралы деректерді өңдеу қағидаларын бұзу кезінде деректерді қорғау бойынша орган 20 млн евро мөлшерінде айыппұл салуы мүмкін.

- Біздің елімізде мұндай заң қабылдануы екі талай. Оның үстіне бізде халықтың саны тек 18 миллиондай, олардың ішінен 5-6 млн адам интернетке тұрақты түрде кіреді. Сонымен қатар қазақстандықтар туралы деректер ешкімге де қызық емес. Егер азаматтары құпиялылық саясаты мен пайдаланушылар келісімін оқып шығуға 2-ақ секунд уақытын бөліп отырса, мемлекет мұндай жағдайда не істей алады? Мемлекет «қызыл жалаушаларды» ғана қоя алады, бірақ адамдар өз қауіпсіздігінің маңыздылығын өздері түсінбейінше, мұндай шаралардан бізге тиер пайдасы шамалы, деп ойлаймын. Көптеген адамдар дербес деректер дегенді мүлдем түсінбейді. Екінші жағынан жеке деректерді бейәдеп, заңсыз пайдалағаны үшін айыппұлдар, ЕО-дағыдай «суық» қоңыраулар әрдайым көмектесе алады. Ең болмаса, осыдан бастасақ болады. Екінші жағынан әрбір адам өзінің деректерінің қауіпсіздігі үшін жауаптылықта болатындығын түсінуі тиіс.

Сұхбаттың бірінші бөлігіне сілтеме: http://lifeinsurance.kz/ekspert/big-data-obratnaya-storona-medali

Бөлісу
Сондай-ақ, қараңыз
ҚР-да балалар қандай жарақаттарға жиі ұшырайды
ҚР-да балалар қандай жарақаттарға жиі ұшырайды

Ұл балалар қыздарға қарағанда 2-3 есе жиірек жа...

Қазақстандағы сақтандыру нарығы 2018 жылы 10%-ға артады.
Қазақстандағы сақтандыру нарығы 2018 жылы 10%-ға артады.

Мұндай пікірді Алматы қ. «Орталық Азиядағы сақ...

Бұл жыл қазақстандық ӨСК үшін көптеген қызықтарды дайындауда
Бұл жыл қазақстандық ӨСК үшін көптеген қызықтарды дайындауда

Жаңа 2019 жыл қарсаңында Lifeinsurance.kz редакциясы өм...

Ең қызықты материалдар сіздің электронды поштаңызда. Біздің жаңалықтарға жазылыңыз.

Сарапшыға сұрақ қойыңыз
Сарапшыға сұрақ қойыңыз
Өтініш қалдыру