Další aktuality
8.7.2025
Jak dostat nazpět peníze z podvodníka?
Chargeback umožní bance naúčtovat peníze obchodu a vrátit je na kartu zákazníkovi. Reklamovat takto je možné pouze platby kartou...

7.7.2025
ESET: Útočníci si výrazně zlepšili češtinu, přesvědčivými e maily v červnu opět nejvíc šířili infostealer Formbook
Malware Agent.CLE útočníci schovávali pod přílohy, které se tvářily jako objednávky...

3.7.2025
Kyberzločinci mají novou zbraň – k telefonním podvodům využívají AI boty
Kyberzločinci mohou s pomocí AI vytvářet přesvědčivé texty, audio-vizuální materiály i interaktivní chatboty...

2.7.2025
Získejte Avast Premium Security zdarma
Zúčastněte se soutěže s magazínem IT Kompas...

27.6.2025
Hrozby pro Android: Útočníci se chystají na léto, v květnu mezi hrozbami nechyběl adware ani zloděj dat
Pozornost bezpečnostních expertů se tentokrát zaměřila právě na zmíněný škodlivý kód Agent.FIV. Ten se letos na předních místech statistiky objevil poprvé...

25.6.2025
36 tisíc skenů za sekundu – analýzy provozu dokládají, jak si kyberzločinci mapují prostor
Tento masivní nárůst automatizovaného průzkumu znamená, že útočníci mají téměř v reálném čase přehled o možných způsobech útoku na různorodé cíle...

23.6.2025
Antivirové Centrum mezi nejlépe hodnocenými na Mapy.com!
Ceníme toho, když najdete čas a ohodnotíte naši snahu napsáním recenze.

20.6.2025
Útočníci si střihli podvody s CapCut
Boom generativní umělé inteligence (AI) je bohužel také živnou půdou pro kyberzločince a podvodníky...

18.6.2025
ESET: Česko bylo v květnu terčem organizované skupiny útočníků, škodlivé kódy nakoupili na dark webu
Že jde o konkrétní útok na Česku republiku, dokazují i e-maily v češtině včetně českých překladů příloh, které obsahovaly zmíněné škodlivé kódy...

9.6.2025
Jak poznat podvodný e-shop?
Některé e-shopy vyvolají podezření ihned. U jiných si nemusíme být jistí. Každý obchod si můžete prověřit, zda není falešný...


více v archivu
potřebujete poradit? - jsme tady

Vytěžování informací z dokumentů pomocí AI

Sdílej na Facebooku
31.5.2024

V dnešní době je velká část informací uložena ve formě dokumentů, jako jsou faktury, smlouvy, formuláře, zprávy, články, knihy a další. Tyto doku­menty obsahují cenná data, ale je potřeba je umět zpracovat. Nejprve je ale musíme z doku­mentů získat – vytěžit. Vytěžování dat z dokumentů je proces, který se snaží extrahovat a strukturovat data z dokumentů pomocí různých metod a technik. Nástup umělé inteligence tuto oblast výrazně zjednodušil a umožnil provozovat ve velkém měřítku. Podívejme se, jak to vlastně funguje.

Co je to vytěžování dat z dokumentů?
Podívejme se nejprve, co to vlastně je vytěžování dat z dokumentů. Je to schopnost získávat data z různých typů a formátů dokumentů, jako jsou PDF, obrázky, skeny, e-maily, tabulky, prezentace, webové stránky a další. Cílem je převést neuspořádaná a nehomogenní data do uspořádané a strukturované formy, která umožňuje jejich snadné zpracování, analýzu a využití v dalších systémech (ERP, CRM, DMS a Workflow...). Vytěžování dat z různých dokumentů je důležitou součástí digitalizace a automatizace procesů.

Nejen faktury
V současné době se s pojmem vytěžování dat setkáme nejčastěji v souvislosti s fakturami a účtenkami. Je to důsledkem toho, že faktury jsou nejčastěji rutinně a ručně zpracovávané dokumenty v rámci firem. Ruční přepis těchto dat často zaměstnává i několik účetních, jejichž kapacita je tak mrhána na rutinní činnosti, místo aby se věnovali smysluplnější a odbornější práci. Vytěžování dat z faktur umožňuje extrahovat důležité informace, jako je datum, číslo, dodavatel, položky, ceny, DPH a další, a automaticky je zaúčtovat do účetního systému, či například spustit schvalování. Tím se zrychlí a zjednoduší celý proces zpracování faktur, sníží se chybovost a ušetří se čas a náklady.

Vytěžování dat z různých dokumentů však není omezeno jen na faktury a účtenky. Existuje mnoho dalších možných scénářů využití této technologie nejen ve firemní sféře. Například:

  • Vytěžování dat z dodacích listů a skladových dokladů umožňuje efektivněji sledovat pohyb zboží, stav zásob či vyřizování objednávek.
  • Vytěžování dat ze smluv, objednávek a nabídek umožňuje extrahovat klíčové podmínky, jako jsou lhůty, ceny, slevy, garance, sankce a další. Tato data lze pak automatizovaně zpracovat v obchodních či CRM systémech a zefektivnit tak kontrolu, vyhodnocování a plánování obchodních aktivit.
  • Vytěžování dat z životopisů, pracovních smluv a hodnocení umožňuje získat informace o zaměstnancích, jako jsou jejich kvalifikace, zkušenosti, kompetence, plnění cílů a další. Data z těchto dokumentů lze využít pro nábor, řízení lidských zdrojů, motivaci a odměňování.
  • Vytěžování dat z lékařských zpráv lze využít k rychlejší a automatizované detekci nestandardních situací – například sekundárních nemocničních infekcí.
  • Vytěžování dat z finančních dokumentů, jako jsou výkazy, transakce nebo auditní zprávy, umožňuje získat informace o finanční situaci, výkonnosti, rizicích nebo příležitostech. Data z těchto dokumentů lze využít pro finanční analýzu, obchodní aktivity nebo detekci podvodů.
  • Vytěžování dat z právních dokumentů, jako jsou smlouvy, rozsudky, žaloby nebo patenty, umožňuje získat informace o právních předpisech, precedentech, argumentech nebo inovacích. Data z těchto dokumentů lze využít pro právní analýzu, poradenství, vymáhání práva nebo ochranu duševního vlastnictví.

Tyto a mnoho dalších příkladů nejsou většinou žádné objevy ani průlomová nová řešení. Většinu těchto dat již máme. Přínosem je ale automatizace a rychlost získání těchto dat ve strukturované podobě pro jejich další zpracování. To, že nejsme závislí na ručním přepisování dat, které někdy vytváří chyby, někdy zpomaluje proces a někdy se vůbec nestane, přináší možnost spustit řadu automatických procesů a především se na ně více spolehnout. I když i kontrola těchto dat, z principu využití AI, musí být pochopitelně součást procesu.

dokumenty, analýza, tablet, stůl, pero

Jak to ta AI dělá?
Nástroje na bázi umělé inteligence využívají různé metody, jako je strojové učení, zpracování přirozeného jazyka nebo optické rozpoznávání znaků, aby extrahovaly data z textu, obrázků, tabulek nebo grafů. Již řadu let se pro získávání dat z dokumentů, nejčastěji třeba právě faktur a účtenek, používají nástroje na bázi strojového učení (Machine Learning – ML). Data se nejprve z obrazové podoby pomocí OCR převedou na text tak, že obsahují i informace o umístění konkrétních slov či čísel v rámci dokumentu (koordináty). Tyto informace následně zpracuje ML model, naučený na historických datech, který určí význam konkrétních dat a ta přiřadí do definované struktury. Tato data jsou pak buď uložena do databáze, nebo předána zpět v určené struktuře (nejčastěji jako XML/JSON soubor). Výhodou těchto modelů je jejich rychlost a možnost učení a úprav pro konkrétní typy dokumentů či požadovaných informací. Právě ale ta možnost učení je současně i určitou nevýhodou – tyto modely musíte na požadovaný typ dokumentů naučit. Současně se tento přístup hodí více na různé strukturované dokumenty (faktury, dodací listy, formuláře...) než na zpracování delších textů.

Co na to populární GenAI?
Některé nástroje na bázi generativní umělé inteligence umí také docela dobře vytáhnout strukturovaná data. Když vyzkoušíte vytěžit fakturu některou z těchto služeb, dostanete celkem dobré výsledky, často na první pohled srovnatelné se specializovanými modely. Nicméně pošlete tam stejnou fakturu znovu. Výsledek, především z pohledu struktury, bude jiný. Museli byste tak před generativní AI postavit propracovaný prompting nástroj, který by se snažil zajistit, abyste dostali stále stejnou strukturu. Současně by tento model nemusel být úplně levný na využití.

Nicméně generativní AI má velkou výhodu při vytěžování textových informací. Její možnosti „pochopení“ textu a získání souhrnu či klí­čo­vých bodů se uplatní při vytěžování dokumentů typu smlouvy, na­bíd­ky, články, případně poptávky. A toto je velká nová oblast využití vytěžování dat, kde můžeme čekat řadu zajímavých nových řešení.

Jak dál?
Vytěžování dat z dokumentů je aktuální disciplína, která zažívá svou renesanci právě i díky trendu umělé inteligence. Vytěžování faktur a účtenek se pomalu stává běžnou komoditou a součástí běžného SW. Nicméně i zde je stále prostor k posunu a narovnání některých oče­ká­vá­ní.

Zdroj: systemonline.cz



Cena:    0 Kč
Něco navíc
máme pro Vás dárek

SPOKOJENÍ ZÁKAZNÍCI

Musím se přiznat, že s tak ochotným a hlavně trpělivým operátorem jsem se už dlouho nesetkal.

Patří mu proto srdečný dík! Domnívám se, že tento neobvyklý přístup operátora k zákazníkovi si zaslouží i zveřejnění


Rudolf Wonka, Litoměřice

#1

Protože jsem laik a nerozumím antivirovým programů velmi si cením s jakou jednoduchostí a elegantností mně dovedla technická podpora předat potřebné informace tak, abych jim porozuměl.

Protože si takového jednání velmi cením, považuji za vhodné poděkovat také Vám za dobře vybraný a proškolený personál.


Roman Jakubík

#2

Chci vám poděkovat
za profesionalitu a za pomoc při instalaci antiviru do počítače.

Moc vám děkuji a zůstáváme nadále vašimi klienty.


Ludmila Ferencová

#3

Moc děkuji za pomoc, už to funguje podle mých představ.

Udělali jste mi radost, že se na vaši podporu mohu spolehnout, to vždy potěší.
Ještě jednou díky a hezký den.


Ivana Stinková
Mělník

#4

Děkuji za odpověď
hned to zkusím.
Pěkné vánoce. Strašně jste mě překvapili rychlou odpovědí.


Dagmar Niklová
Olomučany u Blanska

#5

Dík za pomoc

Konečně jsem KIS nainstaloval. Musím konstatovat, že by se mi to nepodařilo bez vaší pomoci.
Takže ještě jednou díky a hodně zdaru.


Milan Selucký

#6

Dobrý den,

ráda bych Vaším prostřednictvím poděkovala p. Martinovi, který se mi po 2 dny trpělivě věnoval při nastavení antivirového programu.

Je vidět, že umí pracovat nejenom s anti-virem, ale i anti-talentem na PC.

Předejte prosím toto poděkování i jemu nadřízenému pracovníkovi!!


Irena Procházková
MŠ Mezi Domy, Praha

#7

Díky Vašim nástrojům na čištění jsem si mohl vyčistit PC, neboť se neustále zpomaloval a výsledek je pro mne překvapující. Jsem sice laik, ale věřím, že to využívají i odborníci. Děkuji za veškerou tech. pomoc.


Bělík Josef
Praha

#8

Velmi oceňuji přístup firmy k řešení mého problému. Jednalo se o poměrně složitou věc. Díky serióznímu přístupu firmy AntivirovéCentrum jsem problém skutečně vyřešil k mé spokojenosti.


František Farář
Karlovy Vary

#9


Doporučujeme
Eset Nod32 Antivirus, Eset Smart Security Premium, Eset Internet Security

získejte plnou verzi antivirového programu zdarma

Odkazy
Igiho stránka o virech: www.viry.cz

Cílem serveru HOAX.cz je informovat uživatele o šíření poplašných, nebezpečných a zbytečných řetězových zpráv, se kterými se denně setkává a které ohrožují běžné používání internetu.
Vaše řešení kybernetické bezpečnosti - Norton 360
Verze Shop-NET: 2.14.9.25

Možnosti platby:

- převodem na účet
- platební kartou
- dobírkou

VISA Maestro VISA Electron MasterCard

Možnosti dodání:

- elektronické licence - zdarma
- dárky k objednávce - zdarma