Umelá inteligencia DeepSeek: Hrozba zadarmo alebo skvelý AI nástroj???

článok na blog uverejnený: 4. februára 2025

Náhly vzostup umelej inteligencie pod názvom DeepSeek, ktorá pochádza z Číny, vyvolal veľkú vlnu záujmu zo strany verejnosti. Vo všeobecnosti je téma AI posledné mesiace veľmi vyhajpovaná a každým dňom pribúdajú nové AI nástroje, nové LLM modely a umelá inteligencia každý deň otvára nové dvere plné možností. Okrem toho však DeepSeek vyvolal obavy a otázky, najmä o pôvode trénovacích dát, ako aj o bezpečnosti týchto dát a bezpečnosti vašich údajov, respektíve toho, o čom sa s AI rozprávate a aké údaje jej dávate na vstup. Ako lektor kurzov AI vidím tento trend aj na našich kurzoch – školenia zamerané na umelú inteligenciu praskajú vo švíkoch a od založenia našej firmy v roku 2007 sú momentálne najobľúbenejšími v celej našej ponuke. Preto som sa rozhodol napísať tento článok, v ktorom sa pozrieme na DeepSeek, konkrétne na otázky ohľadom pôvodu dát a bezpečnosti. Ak stojíte, sadnite si, ak ležíte, postavte sa, téma je viac než zaujímavá.

 

Čo je vlastne DeepSeek? Pre tých, čo posledné týždne trávili niekde na dovolenke bez internetu – je to nový hráč vo svete umelej inteligencie, ktorý poriadne zamiešal karty. Tento čínsky startup spravil niečo neuveriteľné: za jeden jediný týždeň sa vyšvihol na prvé miesto v počte stiahnutí v amerických app storoch. A nebol to len taký obyčajný úspech – spôsobil také zemetrasenie na burze, že akcionári technologických gigantov ako nVidia a Oracle sa museli poriadne držať za hlavu.

Ževraj open-source?

DeepSeek sa prezentuje ako open-source projekt, čo znie super – však, kto by nechcel transparentnú AI? Problém je v tom, že to nie je tak úplne pravda. V skutočnosti ide len o takzvaný open-weight model, čo v preklade znamená, že vám ukážu len to, čo chcú. Je to ako keby vám niekto dal recept na koláč, ale zatajil hlavnú ingredienciu – môžete vidieť, ako vyzerá výsledok, ale nemáte šancu ho skutočne zopakovať.

A teraz prichádza tá najzaujímavejšia časť – OpenAI, firma stojaca za ChatGPT, obvinila DeepSeek z toho, že používa ich model na trénovanie svojho chatbota. Irónia? Absolútna. Veď práve OpenAI čelila podobným obvineniam pri trénovaní ChatGPT. Je to ako keby zlodej kričal „Chyťte zlodeja!“. A internet sa na tom aj poriadne zabavil, o čom svedčí záplava vtipných memečiek.

Odkiaľ majú dáta? Problém číslo 1

Žiadna AI – umelá inteligencia by nemohla dobre a správne fungovať, pokiaľ by nebola múdra a natrénovaná. To znamená, že niekto ju musel to, čo vie, naučiť. Problémom pri tvorbe veľkých jazykových modelov (LLM) ako sú ChatGPT-4, ChatGPT-3.5, Claude 3.5, GitHub Copilot, Gemini, či DeepSeek R1 sú masívne náklady na ich trénovanie – jednoducho povedané, je extrémne drahé „naliať im do hlavy“ nové informácie tak, aby vedeli normálne reagovať v rôznych kontextoch.

Poďme si to vysvetliť na príklade zo školy. V normálnej triede máte 40 minút výučby, kde učiteľka vysvetľuje látku a potom 5 minút skúša. Pri trénovaní AI modelov je to úplne naopak – model sa rýchlo „naučí“ základy (5 minút) a potom ho musíme dlho a dôkladne skúšať (40 minút). A opravovať.

Tomuto skúšaniu sa hovorí fine-tuning, kde odborníci na rôzne témy testujú model otázkami a podľa jeho odpovedí mu upravujú „známky“. V praxi to znamená, že upravujú váhy jeho parametrov (môžeme to chápať ako jeho „názory“ alebo „presvedčenia“) v rámci rôznych kontextov. Keď model odpovie správne, tieto váhy sa uložia ako správne. Keď odpovie zle, experti ho opravia a ide sa ďalej. A práve toto je ten kameň úrazu – potrebujete kopu kvalifikovaných ľudí, ktorých musíte dobre zaplatiť, aby tento proces robili poriadne.

A tu prichádza DeepSeek so svojím kontroverzným, aj keď neuveriteľne inovatívnym prístupom. Urobili niečo, čo sa v AI komunite považovalo za absolútne tabu – nechali AI model učiť iný AI model. Je to ako keby ste nechali študenta, ktorý sa sám ešte len učí, aby učil iného študenta. Existujú dôkazy, že na toto využívali ChatGPT, čo vyvoláva kopu etických otázok.

Ale to nie je všetko. DeepSeek sa prezentuje ako „open source“ projekt, čo v preklade znamená, že by mal byť otvorený a transparentný. Realita je však úplne iná – je to skôr čierna diera. Nikto poriadne nevie, kam spoločnosť stojaca z DeepSeek ukladá údaje, čo s nimi robí a kto k nim má prístup. Predstavte si to ako školu, ktorá tvrdí, že má otvorené dvere pre všetkých, ale v skutočnosti nikto netuší, čo sa za tými dverami deje. Hlavne, že je to zadarmo.

Najväčším problémom je, že vytvorili precedens – ukázali, že sa dá vytvoriť „relatívne dobrý“ AI model aj bez tradičného ľudského dohľadu. Je to ako keby ste mali triedu bez učiteľa, kde sa študenti učia len od seba navzájom. Môže to síce fungovať, ale nikto nevie, aké dezinformácie alebo chyby si navzájom odovzdávajú. A čo od takých znalostí očakávať.

To, že je model zadarmo alebo lacný, je síce lákavé, ale za akú cenu? Máme tu AI systém, ktorý bol „vychovaný“ iným AI systémom, bez poriadnej kontroly, bez transparentnosti a nikto presne nevie, čo všetko sa počas tohto procesu mohlo pokaziť. Je to ako experiment, ktorý môže mať ďalekosiahle následky pre celý AI priemysel. DeepSeek otvoril Pandorinu skrinku – ukázal, že sa dajú obísť „pravidlá“ trénovania AI, a zároveň vytvoril potenciálne nebezpečný precedens. Ich prístup je síce technicky brilantný, ale eticky prinajmenšom sporný a nikto nevie predpovedať, aké dlhodobé následky to môže mať pre budúcnosť umelej inteligencie.

Čo robia s dátami? Problém číslo 2

Taliansky regulátor pre ochranu súkromia GPDP požiadal DeepSeek o poskytnutie informácií o údajoch, ktoré spracováva v chatbotovi a jeho trénovacích dátach. Pretože vidí riziko pre súkromie miliónov talianskych občanov, GPDP požaduje, aby DeepSeek do 20 dní odpovedal na otázky o:

  • Aké osobné údaje zbiera
  • Odkiaľ dáta pochádzajú
  • Účel zberu
  • Či sú dáta uložené na serveroch v Číne

Podľa talianskej tlačovej agentúry ANSA zmizol DeepSeek 29. januára 2025 z obchodov Google a Apple v Taliansku. Toto bola ich odpoveď.
Zmazali appku z obchodu bez akejkoľvek odpovede. Také typické „východné riešenie“, však?

A ak toto všetko nie je dosť desivé, výskumníci zo spoločnosti Wiz našli verejne prístupnú databázu patriacu DeepSeeku.
„Táto databáza obsahovala významný objem histórie chatov, backend dáta a citlivé informácie, vrátane log streamov, API tajomstiev a prevádzkových detailov.“ Databáza bola nielen prístupná a čitateľná, bola tiež otvorená na kontrolu a eskaláciu privilégií v prostredí DeepSeeku. Nebola potrebná žiadna autentifikácia, takže ktokoľvek, kto na databázu narazil, mohol spúšťať dopyty na získanie citlivých logov a skutočných chatových správ v čistom texte a dokonca kradnúť heslá a lokálne súbory v čistom texte. Netreba dodávať, že toto opomenutie, prehliadnutie vystavilo DeepSeek a jeho používateľov riziku. …možno to nebolo prehliadnutie, ale zámer? Na tieto otázky nám asi nedá nikto odpoveď.

Nič nie je zadarmo, ani AI

Znie to lákavo, však? Bezplatný AI model, ktorý dokáže skoro to isté čo drahé riešenia od známych firiem. Ale ako to už býva, nič nie je zadarmo – a v prípade DeepSeeku je cena možno príliš vysoká.

Máme tu AI systém, ktorý bol „vychovaný“ iným AI systémom bez poriadnej kontroly, bez transparentnosti, s pochybným pôvodom trénovacích dát a s bezpečnosťou na úrovni otvorenej knihy na námestí. Je to ako keby ste mali študenta, ktorého nikdy neskúšal skutočný učiteľ, len jeho spolužiak, ktorý sa učí to isté a všetky jeho poznámky by boli voľne dostupné hocikomu na internete.

To je presne dôvod, prečo sú kvalitné AI modely také drahé – potrebujete armádu expertov, ktorí strávia tisíce hodín kontrolovaním a ladením každej maličkosti, aby model nielen dával spoľahlivé odpovede, ale aj bezpečne chránil vaše dáta.

Ak chcete počuť moju radu – nič nie je zadarmo. Pri používaní DeepSeeku si ho „kupujete“ vlastnými dátami. Navyše je zlý – zle natrénovaný, trepe hlúposti, dezinformuje a zavádza. Je pretrénovaný a väčšinu toho, čo vie, mu poradil ChatGPT a iné platené LLM modely.

Ak chcete používať AI, využívajte overené nástroje ako je Claude AI či ChatGPT. Vo firmách a korporáciách je to Microsoft Copilot, v ideálnom prípade ich platené verzie – už od 20 eur mesačne máte k dispozícii kvalitné a bezpečné nástroje s relatívne dobrým tréningom. To naozaj nie je veľa za istotu, že vaše údaje neskončia niekde na verejnom serveri v Číne čakajúc iba na to, kedy budú v správnom momente zneužité.

Teším sa na vás na našich kurzoch

Budem sa na vás tešiť na niektorom z našich AI kurzov, kde si tieto riziká prejdeme osobne a kde sa budeme učiť s AI pracovať tak, aby vám pomáhala pri každodenných pracovných, či súkromných úlohách bez rizika. Na kurzoch sa dozviete nielen ako efektívne využívať AI nástroje, ale aj ako rozpoznať potenciálne bezpečnostné hrozby a chrániť svoje dáta. Veď predsa nikto z nás nechce, aby jeho súkromné informácie skončili niekde, kde nemajú čo robiť.

Kurz umelá inteligencia (AI) prakticky I. - Úvod do AI, generovanie textov, vlastný chat GPT asistent vo vašej firme a využitie v IT, v marketingu a pri podnikaní
Umelá inteligencia (AI) prakticky I. Úvod do AI, generovanie textov, vlastný chat GPT asistent vo vašej firme a využitie v IT, v marketingu a pri podnikaní
Školenie Umelá inteligencia (AI) prakticky II. - Prompty a praktické cvičenia v ChatGPT, Google Gemini a Claude
Umelá inteligencia (AI) prakticky II. Prompty a praktické cvičenia v ChatGPT, Google Gemini a Claude
Kurz Umelá inteligencia (AI) prakticky III. - pokročilé možnosti ChatGPT, AI generovanie grafiky, videí, hudby, hlasu a práca s dokumentami PDF, Word, Excel a PowerPoint
Umelá inteligencia (AI) prakticky III. pokročilé možnosti ChatGPT, AI generovanie grafiky, videí, hudby, hlasu a práca s dokumentami PDF, Word, Excel a PowerPoint
Umelá inteligencia (AI) komplexný praktický kurz - od základov po generatívnu AI: prompty, grafika, dokumenty, hudba, hlas, vlastný GPT model a praktické využitie doma aj vo firme
Umelá inteligencia (AI) od základov po generatívnu AI: prompty, grafika, dokumenty, hudba, hlas, vlastný GPT model a praktické využitie doma aj vo firme
Kurz Microsoft Copilot 365 prakticky - využitie AI asistenta a AI funkcií vo Windowse, Word, Excel, PowerPoint a Outlooku
Microsoft Copilot 365 prakticky využitie AI asistenta a AI funkcií vo Windowse, Word, Excel, PowerPoint a Outlooku

Autor článku: Peťo Hecht autorom článku je: Peťo Hecht

Peťo je lektorom od vzniku našej spoločnosti, so špecializáciou na online marketing, reklamu, tvorbu webových stránok, WordPress, grafiku a AI - umelú inteligenciu. S viac ako 20-ročnými skúsenosťami a viac než 100 odprednášanými hodinami mesačne patrí medzi našich najskúsenejších lektorov. Ako marketingový riaditeľ a vedúci marketingového a personálneho oddelenia je zodpovedný za vizuálnu podobu našich webových stránok. Naša webová stránka je jeho dielom, ktoré dokonale odráža jeho odborné znalosti – od každého slova, cez obrázky, až po farebné schémy. Okrem toho Peťo navrhuje, programuje, kreslí a poskytuje konzultácie v oblasti online marketingu aj pre ďalšie spoločnosti. Na svojich kurzoch ochotne zdieľa praktické skúsenosti a know-how. Prednášal tiež vybrané marketingové témy na Fakulte manažmentu Univerzity Komenského.

Páčil sa vám článok? Pošleme vám podobné.
Aktivujte si okamžité zasielanie noviniek a článkov – už vám od nás nikdy nič neunikne. Môžeme vás okamžite informovať o aktuálnej akcii, novinke, špeciálnej kampani či zľave alebo novom článku na našom blogu. Akonáhle sa u nás v novinkách niečo zmení alebo pridá, do pár minút vám automaticky posielame email s odkazom na novinku na našu stránku. A odhlásiť sa môžete kedykoľvek. Nič neriskujete.


Nikam neodchádzajte, pozrite si naše novinky, akcie alebo si
prečítajte ďalšie podobné články:

Podobné články z kategórie
ai, bezpecnost, umela inteligencia


Aktuálna akcia na IT kurzy a počítačové a marketingové kurzy v Bratislave