INOGILE/Blog/Prečo vaše firemné dáta nie sú v AI bezpečí (a čo s tím)

2026-04-14

Umelá Inteligencia

Prečo vaše firemné dáta nie sú v AI bezpečí (a čo s tím)

2026-04-14

Umelá Inteligencia

Martin Jurek

CEO, Inogile

Bezpečnosť umelej inteligencie a ochrana firemných dát – prednáška INOGILE

Prečo váš chatbot potrebuje vlastný domov

Dnes je všetko AI. AI mixér, AI záchodový papier, dokonca aj AI proteín. Ak váš produkt nemá v názve tieto dve písmená, akoby ani neexistoval.

Ale kým sa svet vezie na vlne hypu, my v Inogile (áno, predtým sme boli tí „Starbug chlapci“) sme sa pozreli pod kapotu. A poviem vám – nie je to vždy pekný pohľad.

Možno ma poznáte ako človeka, čo sa nebojí povedať veci narovinu. Takže tu je krutá pravda: Vaše firemné tajomstvá sú pravdepodobne práve teraz tréningovým materiálom pre Google alebo OpenAI.

Sú dnešné modely bezpečné? Spoiler: Nie.

Keď som si čítal Privacy Policy pre Gemini, skoro mi zabehla káva. Google tam čiernym na bielom píše: „Nezadávajte dôverné informácie.“ Prečo? Lebo ich vidí kontrolór, Google ich používa na učenie a zajtra ich váš konkurent môže dostať ako odpoveď na svoj prompt.

Podobné podmienky používania nájdete aj u konkurenčného ChatGPT, ktorý tiež hovorí, že používa dáta na strojové učenie. Novinka je, že sa viete z daného učenia odhlásiť a priamo v nastavení si danú funkciu vypnúť. Či reálne vypnutie tejto funkcie zabezpečí, že vaše dáta nebudú zdieľané – to nechávam na zodpovednosti každého z vás.

Minimálne odporúčam nastaviť nasledovné nastavenie v GPT (skôr pre dobrý pocit bezpečia):

Inštruktáž ako vypnúť trénovanie AI modelu a zdieľanie dát v nastaveniach ChatGPT

Reálne „miliónové fuck-upy“

A nie je to len teória. Máme tu reálne prípady, ktoré stáli firmy milióny:

Samsung (2023)

Zamestnanci Samsung Semiconductor vložili do ChatGPT zdrojový kód z databázy čipov, kód na optimalizáciu defektných zariadení a prepis interného meetingu – tri samostatné incidenty za 20 dní. Výsledok? Všetky tieto dáta sa stali súčasťou tréninkových dát OpenAI. Samsung to už nedokázal vziať späť – dáta sú na serveroch OpenAI a podľa ich vlastných slov ich nevedia vymazať z konkrétnych promptov.

Samsung po tomto incidente obmedzil vstupy do ChatGPT na 1024 bajtov a začal vyvíjať vlastný interný AI nástroj (Gauss). V roku 2025 uvoľnil prístup k ChatGPT s novými bezpečnostnými protokolmi.

ChatGPT konverzácie na Googli (2025)

V lete 2025 sa ukázalo, že zdieľané konverzácie z ChatGPT boli indexované priamo v Google vyhľadávaní. Stačilo do Google napísať site:chatgpt.com/share a mohli ste nájsť životopisy s plnými menami a telefónnymi číslami, firemné stratégie, API kľúče, dokonca aj osobné vyznania.

Ako sa to stalo? ChatGPT mal funkciu „Share“ s checkboxom „Make this chat discoverable.“ Problém bol, že robots.txt OpenAI povoĺoval indexovanie týchto stránok a chýbali noindex tagy. Takže Google urobil to, čo robí vždy – zaindexoval všetko, čo mohol. Odhaduje sa, že bolo zaindexovaných viac ako 100 000 konverzácií.

OpenAI funkciu nakoniec zrušil a požiadal Google o deindexáciu. Ale mnohé konverzácie sú stále dostupné na Archive.org. Navždy.

Riešenie? Postavte si vlastného agenta. Na vlastnom železe.

Zákazník nechce počuť, že jeho dáta sú „možno“ v bezpečí. Chce mať istotu. Preto v Inogile razíme cestu offline AI agentov.

Čo k tomu potrebujete?

Poriadny komp: Zabudnite na predražené workstation. Najlepší pomer cena/výkon na beh LLM má dnes Mac Mini s Apple Silicon. Vďaka zdieľanej pamäti (unified memory) funguje excelentne – GPU a CPU zdieľajú rovnaký pamäťový priestor, čo je presne to, čo LLM modely potrebujú.
Prehrávač – Ollama: Predstavte si to ako Winamp pre umelú inteligenciu. Stiahnete model (napríklad Llama od Meta alebo Mistral) a pustíte ho u seba. Bez internetu. Vaše dáta nikdy neopustia vašu budovu.
Python: Trochu kódovania, ktoré to celé spojí do funkčného celku.

Zlatý grál: Naučte model vaše dáta

Poznáme viacero typov učenia modelov. Jeden je SFT (Supervised Fine Tuning) – plnohodnotné dotrénovanie modelu na vašich dátach. Je to výkonné, ale drahé a časovo náročné. Pre mnoho prípadov existuje jednoduchšia cesta: RAG (Retrieval-Augmented Generation).

RAG je v podstate „obalovač“ otázok. Predstavte si, že máte model, ktorý vie veci len do roku 2023. Je to taký malý hlúpučký génius v krabici. Keď sa ho spýtate na vašu firmu, nevie nič.

Ale ak medzi vás a AI vložíte RAG vrstvu, tá zoberie vašu otázku, pridá k nej aktuálne dáta (napríklad vaše obchodné podmienky alebo produktový katalóg) a podhodí to modelu s inštrukciou: „Odpovedz na toto, ale použi len tento kontext.“

Výsledok? Máte chatbota, ktorý pozná vaše najnovšie produkty, ale vaše dáta nikdy neopustia budovu.

Dôležité je vedieť, že RAG nie je zázrak. RAG obalovač otázok tiež čerpá tokeny, ktoré vie model spracovať. Čím viac dát je obsiahnutých v RAG súbore, tým menej priestoru ostane modelu na samotnú odpoveď. Pre komplikovanejšie prípady – veľký objem dát, zložité štruktúry – sa firma nevyhne plnohodnotnému učeniu cez SFT.

Personalizácia: Od seniora po Generation Alfa

Krása vlastného orchestrátora (to ste vy – taký Tony Stark vašej AI) je v tom, že si môžete vyladiť správanie:

Chcete, aby AI odpovedala právnikovi? Použije odbornú terminológiu a presné formulácie.
Chcete odpoveď pre 12-ročného „hobita“ z generácie Alfa? RAG mu povie, že váš produkt je „OMG fr úplne topičko.“

Áno, umelá inteligencia sa rada „rozpindáva“, lebo chce z vás vytiahnuť tokeny (za ktoré sa v cloude platí). Ale vo vlastnom systéme jej jednoducho prikážete: „Buď stručná a nerob zo mňa hlupáka.“ A ona poslúchne.

Verdikt: Potrebujete na to IT firmu?

Asi ma teraz podozrievate z narcizmu, ale odpoveď je: áno.

Jasné, RAG súbor si vygenerujete aj sami cez ChatGPT (ak vám nevadí, že sa na vás zasa učí). Ale postaviť robastný systém, kde nič nehorí, databázy fungujú a zákazník má reálnu hodnotu – to je už iná liga.

RAG je super pomocník, ale stále to treba brať skôr ako efektívny nástroj na zlepšenie produktivity, nie ako náhradu plnohodnotného AI riešenia. Pre komplikovanejšie scénáre je SFT nevyhnutné.

Budúcnosť nie je v tom, kto má väčšie predplatné v OpenAI. Budúcnosť je v tom, kto dokáže AI skrotiť, zabezpečiť a prinútiť ju pracovať na vlastných dátach. My v Inogile to už robíme.

Máte odvahu odpojiť sa od cloudu a začať naozaj vlastniť svoju inteligenciu?

Zastavte sa u nás, otestujeme vás.

Obsah článku

Prečo váš chatbot potrebuje vlastný domov

Sú dnešné modely bezpečné? Spoiler: Nie.

Reálne „miliónové fuck-upy“

Riešenie? Postavte si vlastného agenta. Na vlastnom železe.

Zlatý grál: Naučte model vaše dáta

Personalizácia: Od seniora po Generation Alfa

Verdikt: Potrebujete na to IT firmu?

Máte odvahu odpojiť sa od cloudu a začať naozaj vlastniť svoju inteligenciu?

Ďalšie články

2026-04-14

Umelá Inteligencia